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METODOLOGÍA DE LA INVESTIGACIÓN 
DEFINICIONES 


Ciencia: Es un creciente cuerpo de ideas organizadas en un sistema de 
conocimientos caracterizado como racional, sistemático, exacto, verificable y falible. 


Conocimiento Científico: Es un sistema de ideas establecido provi¬ 
sionalmente. 

Investigación Científica: Es la actividad que procura el conocimiento 
objetivo (hechos) o de entes ideales (abstractos e interpretados) que solo existen 
en la mente humana. La ciencia aplicada al mejoramiento de nuestro mundo na¬ 
tural y artificial, a la inversión de bienes materiales y culturales se convierte en 
tecnología. La ciencia como creadora del mundo de la cultura es un sistema de 
ideas establecidas provisionalmente (conocimiento científico) y como actividad 
es productora de nuevos conocimientos (investigación científica). 

Ciencias Formales o Ideales: Es un conocimiento racional, sistemático y 
verificable, pero no es objetivo, no dan información de la realidad. La lógica, la 
matemática, entre otras, establecen contacto con la realidad a través del lenguaje 
ordinario y científico. 

Ciencias Deductivas: Las Ciencias Fácticas o materiales se ocupan de los 
hechos usando un conocimiento racional y objetivo. Usan los procesos inductivos 
o deductivos. Entre ellas se encuentran las Ciencias de la Salud y de la Sociedad. 

Características de las Ciencias Fácticas: Se caracterizan por lo siguiente: 

- El conocimiento científico es fáctico, esto es, está basado en hechos. 

- El conocimiento científico trasciende los hechos y crea nuevos hechos. 

- La ciencia es analítica, esto es, se descompone en elementos. 
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- La investigación científica es especializada. 

- El conocimiento científico es sistemático. 

- El conocimiento científico es general. 

- El conocimiento científico es legal. 

- El conocimiento científico es predictivo. 

- La ciencia es explicativa. 

- La ciencia es abierta. 

- La ciencia es útil. 

La tecnología no es solo una aplicación del conocimiento científico a 
problemas prácticos, es el enfoque científico de los problemas prácticos. Todo 
avance tecnológico plantea problemas científicos. 

Métodos de Ciencia: Son familia de métodos, cada uno de los cuales 
difiere de acuerdo a la materia involucrada, a la medida del fenómeno y la 
experimentación u observaciones repetidas. Entre los métodos de la Ciencia se 
incluye el estudio de la hipótesis científica, la inducción, además de teorías, leyes y 
métodos de explicación. 

El Método Científico: Se aplica en la Ciencia no experimental, 
observacional y teórica así como también en la Ciencia Experimental. 


Métodos de Investigación: 

1.- Existen métodos lógicos o generales aplicados a todos los campos de la 
investigación. Entre ellos se encuentran: i : 

a.- El Método Científico Inductivo-Deductivo. En él se siguen los siguientes 
pasos: 

- Recolección de los hechos por observación o experimentación. 

- Formulación de las hipótesis que expliquen los hechos en 
términos de causas y efectos. 

- Deducciones de la hipótesis. 
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- Verificación de las deducciones por nuevas observaciones o 
nuevos experimentos. 

b. - El Método Empírico. 

c. - El Método Experimental. 

d. - El Estudio de Casos. 

e. - El Método de Encuesta. 

f. - El Método Estadístico. 

g. - El Método Histórico. 

h. - El Método Sintético. 

2 .- Métodos Especiales o técnicos. 

Hipótesis: Es la explicación lógica o supuesto sobre algunos hechos que 
parten de las observaciones que son de nuestro interés. La hipótesis puede ser 
establecida como ecuación matemática y se denomina Modelo Matemático. 
Cuando una hipótesis soporta un considerable número de pruebas que miden su 
respetabilidad es llamada Teoría y cuando sobrevive a un gran número de 
observaciones se convierte en Ley. 


Predicción: es la conducción de un experimento en la imaginación; puede 
hacerse una predicción lógica de ciertas consecuencias de la hipótesis que bajo 
condiciones naturales específicas pueden ser observadas en caso de ser verdadera, 
pero no ha sido observada. 

El método científico aplicado a la comprobación de afirmaciones 
informativas se reduce al método experimental. La experimentación involucra la 
modificación deliberada de algunos factores, es decir, la sujeción del objeto de 
experimentación a estímulos controlados. La astronomía no experimenta con 
cuerpos celestes, pero es una ciencia empírica porque aplica el método 
experimental. 

La esencia de un experimento es que nos capacita para comparar los efectos 
de dos o más tratamientos sobre algunos atributos de plantas, animales u otro 
material experimental. 
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- Verificación de las deducciones por nuevas observaciones o 
nuevos experimentos. 

b. - El Método Empírico. 

c. - El Método Experimental. 

d. - El Estudio de Casos. 

e. - El Método de Encuesta. 

f. - El Método Estadístico. 

g. - El Método Histórico. 

h. - El Método Sintético. 

2 .- Métodos Especiales o técnicos. 

Hipótesis: Es la explicación lógica o supuesto sobre algunos hechos que 
parten de las observaciones que son de nuestro interés. La hipótesis puede ser 
establecida como ecuación matemática y se denomina Modelo Matemático. 
Cuando una hipótesis soporta un considerable número de pruebas que miden su 
respetabilidad es llamada Teoría y cuando sobrevive a un gran número de 
observaciones se convierte en Ley. 


Predicción: es la conducción de un experimento en la imaginación; puede 
hacerse una predicción lógica de ciertas consecuencias de la hipótesis que bajo 
condiciones naturales específicas pueden ser observadas en caso de ser verdadera, 
pero no ha sido observada. 

El método científico aplicado a la comprobación de afirmaciones 
informativas se reduce al método experimental. La experimentación involucra la 
modificación deliberada de algunos factores, es decir, la sujeción del objeto de 
experimentación a estímulos controlados. La astronomía no experimenta con 
cuerpos celestes, pero es una ciencia empírica porque aplica el método 
experimental. 

La esencia de un experimento es que nos capacita para comparar los efectos 
de dos o más tratamientos sobre algunos atributos de plantas, animales u otro 
material experimental. 
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El Método Estadístico: Permite al investigador científico, planificar, 
analiz ar e interpretar los resultados de sus investigaciones, concluir y recomendar. 

El método estadístico cuantifica las observaciones y sigue los siguientes pasos: 

- Recolección y resumen de los datos. 

- Diseño experimental y muestreo. 

- Medición de la magnitud de la variación en datos experimentales. 

- Estimación de los parámetros 

- Prueba de hipótesis acerca de poblaciones. 

- Relación de las variables. 

La Estadística es la ciencia que crea y desarrolla métodos para la 
recolección, organización, clasificación y análisis de datos a partir de muestras 
evaluadas a la luz de la incertidumbre. 

Métodos de la Ciencia No Experimental: El esquema para los procesos 
de la Ciencia no experimental (ej. astronomía, ecología) es el siguiente: 

METODO DE LA CIENCIA NO EXPERIMENTAL 

(1) Observación bajo Literatura 

condiciones naturales (Obs. e Hip.) ] 

.1 

(2) Hipótesis ' 

.r., 

(3) Predicción j 

i 

♦ 

(4) Observaciones posteriores 
bajo condiciones naturales 
y comparación con (1) 
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Métodos de la Ciencia Experimental El esquema para los procesos de 
la Ciencia experimental (ej. física, química) es el siguiente: 

METODO DE LA CIENCIA EXPERIMENTAL 


(1) Observación bajo j Literatura j 

condiciones naturales j (Obs. Hip.) , 



Nuevos Problemas 


Características de los métodos de la Ciencia: La matemática, la 
astronomía y la física constituyeron en el pasado campos de útil solución de 
problemas. En el resto de los diferentes campos se obtenían resultados 
provenientes de la experiencia y garantizados por su utilidad técnica. 
Posteriormente el método científico se aplicó y fue modificado en los campos de 
la química y de la biología y en la actualidad se aplica a los problemas de la 
sociedad o Ciencias de la Conducta Humana. 


Existe la obligatoriedad en la preparación personal, para el pensamiento 
científico, la necesidad de adquirir el conocimiento a través del dominio de los 
hechos. El dominio de los hechos no se adquiere simplemente escuchando lo 
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que explica otra persona, sino que es la recompensa de los propios esfuerzos, se 
adquiere cuando a la investigación y a la experimentación se le ha dedicado mucho 
tiempo, siguiendo un sistema ordenado y un buen método, especialmente 
cultivando el hábito de distinguir entre las cosas que 1 tienen importancia y las que 
no la tienen. Se podría añadir la imaginación proyectada hacia la búsqueda de 
causas y efectos. 


En síntesis, el método científico es el producto de una metodología 
usada correctamente, una actitud crítica y un intenso trabajo que lleva de la 
incertidumbre a la probable certeza. El método científico es el procedimiento 
reflexivo, controlado y crítico que permite descubrir nuevos hechos o datos, 
relaciones o leyes, en cualquier campo del conocimiento humano. Comprende la 
formación y definición de problemas, la formulación de hipótesis, la recopilación, 
sistematización y elaboración de datos, la formulación de deducciones y 
proposiciones generales y por último, el análisis de las conclusiones para determinar 
si confirman las hipótesis formuladas y encajan dentro del marco teórico del que 
se partió. 


La investigación dentro de las ciencias fácticas o empíricas, por su 
vinculación a una realidad concreta referida al mundo que nos rodea, debe 
observar, describir, explicar, formular supuestos o predicciones sobre hechos 
específicos de ese mundo real y concreto, para tales supuestos la validez debe ser 
verificada por la experiencia, lo cual corresponde a la aplicación correcta del 
método científico. La investigación en el campo de la Agronomía corresponde 
justamente a estas ciencias bien sean naturales o sociales. 


Persiguiendo la investigación fines concretos, su proceso requiere 
fundamentalmente del equilibrio entre la metodología y las técnicas. En ese orden 
de ideas, la metodología describe, analiza y valora críticamente los métodos de la 
investigación, por lo que el método o conjunto de ellos representa los 
procedimientos o caminos a seguir, mientras que las técnicas son sus auxiliares o 
maneras de recorrer el camino, de allí que los métodos son generales y las técnicas 
particulares. 
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El método científico se caracteriza por ser fáctico, trasciende los hechos, 
verifica empíricamente, confronta la realidad, es autocorrectivo y progresivo, 
formula en forma general y su objetivo es alcanzar la verdad fáctica. El método 
científico queda entonces enmarcado entre la realidad y la teoría, por lo que en 
todo trabajo de investigación debe manejarse los llamados elementos básicos del método 
científico-. Sistema conceptual, hipótesis, definiciones, variables e indicadores. 


El sistema conceptual está constituido por construcciones lógicas, 
producto del hombre, y permite la aprehensión de un hecho o fenómeno, La 
hipótesis es el nexo entre la teoría y la realidad empírica, siendo el instrumento 
que permite probar las relaciones entre hechos. La definición, fundamentalmente 
es en términos de operaciones efectivas de acuerdo con la ciencia moderna, las 
variables son características propias de los individuos y los indicadores surgen de 
la observación y son las dimensiones de las variables. 

Planificación y etapas en un plan de investigación: La proyección del 
trabajo de investigación responde a una estructura lógica de decisiones y a una 
estrategia que garantice la obtención de respuestas adecuadas. La planificación 
corresponderá entonces a aspectos científicos y administrativos que deben 
responder al qué y para qué de la investigación, al cuándo y dónde, el cómo y con 
qué se vá a investigar un aspecto de la realidad en el campo de las ciencias naturales 
o sociales. 


Con un conocimiento cabal de lo anteriormente expuesto se bosqueja 
un esquema orientador de las etapas generales que debe cubrir un plan de 
investigación: 


1. - Formulación del problema(s) y la(s) hipótesis. 

2. - Elaboración del diseño de la investigación 

3. - Delimitación del trabajo de investigación. 

4- Constitución del equipo de investigación. 

5.- Selección de métodos y técnicas. 
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6. - Organización del material de investigación. 

7. - Recopilación de los datos. 

8. - Elaboración de los datos. 

9. - Análisis e interpretación de los datos. 

10. - Redacción del informe de investigación.-” 


En forma resumida, se pueden expresar las siguientes ideas a manera de 
conclusión: 

- La metodología de la investigación exige el estudio de la lógica y la 
Teoría del Conocimiento para su cabal entendimiento. 

- El trabajo de investigación es el resultado del equilibrio entre la 
metodología y las técnicas de investigación, lo cual garantiza una correcta ejecución 
y respuestas adecuadas. 

- Debe diferenciar claramente entre metodología, métodos y técnicas de 
investigación. 

- La planificación responde a aspectos científicos y administrativos por 
lo que puede ser conformado dentro de un conjunto de etapas generales que 
deben cumplirse con ciertas variantes de acuerdo a la índole del trabajo de 
investigación. 
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DISEÑO DE EXPERIMENTOS 
DEFINICION 

Diseñar un experimento es planificarlo de forma tal, que reúna la 
información que se requiere del problema planteado en la investigación. Consiste, 
por consiguiente, en una secuencia de pasos que garanticen que los datos que se 
obtienen hagan posible un análisis objetivo, el cual permitiría llegar a interpre¬ 
taciones, conclusiones y recomendaciones válidas en el estudio. Éstas también 
dependen de la experiencia y criterio del investigador. 

Es muy frecuente que se coleccionen datos que aporten poco o nada a la 
solución de problemas planteados. Por lo tanto, es necesario planificar los 
experimentos con antelación de manera que la información que se recolecte esté 
acorde con los objetivos, fines y alcances de la investigación y mediante la 
información que se genere se pueda llegar con precisión a definir la aceptación o 
rechazo de la hipótesis de trabajo. 

La planificación del experimento se hace fundamental, con el objeto de 
proporcionar la mayor cantidad posible de información sobre el problema 
estudiado. 

PRINCIPIOS BÁSICOS DEL DISEÑO EXPERIMENTAL 

Los principios básicos del diseño experimental son: 

^ Aleatorización 
Replicación 
Control Local 

Aleatorización: Uno de los supuestos del análisis de la Varianza hace 
referencia a la independencia de los errores, ésto es, los errores de las observaciones 
deben estar distribuidos independientemente. Surge la pregunta ¿Cómo corro¬ 
borar que esta suposición es verdadera?. En cierta forma no es posible, sin embargo, 
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el hecho de hacer una asignación al azar de los tratamientos a las unidades 
experimentales hace que la suposición pueda considerarse válida. La aleatorización 
hace válida la prueba y esto la hace apropiada para analizar los datos como si la 
independencia fuera un hecho. Esta referencia se hace ya que existen errores 
asociados con unidades experimentales adyacentes en espacio o tiempo y estos 
tenderán a correlacionarse y la aleatorización sólo asegura que el efecto de la 
asociación sobre cualquier comparación entre los tratamientos se haga tan pequeña 
como sea posible, sin embargo la correlación siempre existe y ésta no puede 
eliminarse totalmente. 

En síntesis, nunca existe una independencia completa y verdadera, pero debe 
buscarse dicha independencia y la mejor manera de buscarla es mediante la 
Aleatorización. Se puede expresar que la aleatorización es un principio importante, 
ya que es un instrumento para eliminar tendencias, sistematización y subjetividad. 

Replicacion: Se refiere a la repetición del experimento básico; por lo tanto, 
es la repetición de las diferentes unidades experimentales que conforman un 
experimento. En muchos casos la repetición puede ser de todas las unidades 
experimentales, de parte de ellas o de una sola unidad experimental. Las razones 
del porqué las replicaciones son indispensables son las siguientes: 

- Mediante la replicacion se puede obtener una estimación válida del error 
experimental y a su vez éste es necesario ya que se utiliza en la estimación de los 
parámetros de la población y en las pruebas de hipótesis. 

- Bajo una serie de suposiciones el error experimental puede ser estimado sin 
tener replicaciones, sin embargo las replicaciones son convenientes ya que proporcionan, 
la mayor parte de las veces, una estimación más aproximada del error. 

- Se obtiene una estimación más precisa del efecto medio de cualquier 
factor, ya que se conoce lo siguiente: 

<Ty = cr 2 / n 

donde ¡y 1 = error experimental 
n = número de replicaciones 
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La varianza de la media es igual a la varianza por unidad entre el número de 
replicaciones, en consequencia, a medida que las replicaciones aumenten disminuye 
el efecto promedio del factor. 

Control Local: Este principio se refiere a la cantidad de balances, bloqueo 
y agrupamiento de las unidades experimentales que se utilizan en un diseño 
experimental. Con la aplicación del control local se trata de disminuir el error 
experimental con el control de uno o varios factores de variabilidad que de no 
controlarse formarían parte del error experimental y por consiguiente abultarían 
dicho error. La función del control local es la de hacer el diseño experimental 
más eficiente; esto es, más sensible a las pruebas de significación o hacer más 
poderosos los procedimientos de prueba, debido a que se espera conseguir una 
disminución en la magnitud del error experimental 

DEFINICIONES BÁSICAS 

Tratamiento: Hace referencia a un factor o a una combinación de factores 
controlables. Se define como tratamiento a un conjunto particular de condiciones 
experimentales que deben imponerse sobre las unidades experimentales de un 
experimento. El término entró en la literatura debido a su uso en experimentación 
agrícola, pero actualmente ha perdido su connotación estrictamente agronómica 
y ha entrado a formar parte del lenguaje de los estadísticos. Se darán ilustraciones 
del uso de esta terminología en algunos campos: 

En Física: Por ejemplo, en experimentos sobre bacterias los tratamientos 
pueden ser varias combinaciones de la cantidad de electrolitos y la temperatura 
de activación de las bacterias. En otro tipo de ensayo, se podría incluir otros 
factores tales como el tipo de material de construcción. 

En Química: 

En experimentos sobre rendimiento de cierto proceso químico, los 
tratamientos pueden ser: 

Diferentes temperaturas en la cual se ejecuta el proceso. 

Cantidad de reactivo usado. 

Pureza de los reactivos usados. 
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EnAgronomív. 

Cantidad de mezcla de determinado fertilizante. 

Cantidad de determinados nutrientes o combinaciones de cantidades 

de nutrientes utilizados. 

Diferentes variedades o línea de cultivo. 

Distintas densidades de siembra. 

Profundidad de siembra. 

EnZooteenuu 

Diferentes raciones alimenticias dadas al animal. 

Sexo y raza de los animales. 

Cantidad de leche o concentrado suministrado a becerros, novillos. 

En Psicologíay Sociología; 

Edad. 

Sexo. 

Altura de los individuos. 

Nivel educativo, entre otros. 

Unidad Experimental: Los resultados de un experimento están afectados 
no solamente por el efecto del tratamiento sino también por una serie de 
variaciones extrañas que tienden a encubrir los efectos de los tratamientos, llamado 
error experimental. Existen dos fuentes principales de error experimental: La 
variabilidad inherente al material experimental a la cual se aplican los tratamientos, 
y la falta de uniformidad en la conducción física del experimento; es decir, la 
deficiencia en poder utilizar unifórmente la técnica experimental. Uno de los 
aspectos principales que se debe tomar en cuenta con respecto a este último, es la 
adecuada escogencia de la Unidad experimental. 

Se define como unidad experimental a la más pequeña unidad a la cual se 
aplica independientemente un tratamiento. La unidad experimental representa al 
conjunto de material experimental al cual se le aplica un tratamiento en un solo 
bloque. 
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La unidad puede ser una parcela sembrada de maíz, ajonjolí, tomate o un 
grupo de cerdos, bovinos, ovinos o un lote de semillas. Es común que tales 
unidades experimentales produzcan diversos resultados aun cuando son sometidos 
al mismo tratamiento, estas diferencias contribuyen a formar los errores 
experimentales. 

Tamaño y forma de la Unidad Experimental: El tamaño y forma de la 
unidad experimental son importantes, tanto desde el punto de vista de variabilidad 
como económico. Se La comprobado que la variabilidad tiene una relación 
inversa con el tamaño de la unidad, a medida que el tamaño aumenta la variabilidad 
disminuye. Una medida de esa variabilidad puede ser por ejemplo el coeficiente 
de variación, el cual se expresa a través de la siguiente expresión: 


siendo S I a desviación estándar de las observaciones y % la media de las 
observaciones. 

En el análisis de la varianza, la desviación estándar es medida en base a la 
raíz cuadrada del cuadrado medio del error, lo cual se expresa en la forma siguiente: 

S 2 = CMEE lue go, S = V CMEE 

Si se gráfica el coeficiente de Variación y el tamaño de la parcela se 
obtendrá la curva mostrada en la Figura. 2.1 Como puede observarse en el 
gráfico existe una relación inversa entre el coeficiente de variación y el tamaño de 
la parcela. ^ 
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Figura 2.1 Coeficiente de Variación versus tamaño de la Parcela. 


Otro aspecto importante que se debe tomar en cuenta a la hora de planificar 
el experimento es lo referente a la escogencia de la forma que debe tener la 
unidad experimental ya que de esta puede depender el aumento o disminución 
de la precisión en los resultados. En experimentos agrícolas vegetales se ha 
comprobado que las parcelas rectangulares son menos variables que las cuadradas 
de igual tamaño; sin embargo, se pueden planificar experimentos en los cuales 
las bordurcts sean importantes. Por ejemplo, en experimentos con maquinaria agrícola, 
la razón primordial es que las parcelas cuadradas tienen menor perímetro para 
igual área que las parcelas rectangulares, a esto se debe la escogencia de las parcelas 
cuadradas en esta área. 

El aspecto económico también debe privar en la escogencia del tamaño de 
la parcela, muchos experimentos son llevados en áreas grandes injustificadas no 
solamente desde el punto de vista de variabilidad, sino de costos. 

Existen una serie de métodos que nos permiten determinar tamaño y forma 
de la parcela óptima, tomando en cuenta la heterogeneidad, costos y número de 
repeticiones. Estos métodos son: 

- Método de Máxima Curvatura. 

- Método de Máxima Curvatura Modificado. 

- Método Fairfield Smith. 
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- Método Koch y Rigney. 

- Método de las Regresiones Múltiples. 

- Método de Hatheway. 

- Otros métodos nuevos. 

Arreglo y número de Bloques: El bloque es una de las formas de 
agrupamiento de las unidades experimentales. Se ha demostrado en experimentos 
agrícolas que las parcelas cercanas tienden a ser más similares que las parcelas 
apartadas; esto se ha demostrado en los ensayos de uniformidad. Debido a esto 
es común en estos ensayos colocar parcelas vecinas en un solo grupo, tratando de 
poner las parcelas de tal manera que el grupo sea aproximadamente cuadrado, 
esto siempre y cuando sea posible. Con frecuencia las parcelas contiguas forman 
una buena base para el agrupamiento, incluso en ensayos de umbráculo o de 
invernadero, donde en diferentes estratos o lugares pueden existir diferencias en 
temperatura, luz solar, corriente de aire o accesibilidad al riego. Por otro lado es 
importante señalar que en muchos experimentos con plantas o, más particu¬ 
larmente, con animales, la localización física de las unidades experimentales a 
través del experimento tiene poca importancia. 

En el caso de experimentación con animales es posible que un animal pueda 
constituir el bloque en aquellos casos en que los tratamientos puedan aplicarse 
sucesivamente al mismo animal, sin producir efectos residuales que oscurezcan 
los resultados. Uno de los agrupamientos de unidades experimentales más sim ple 
es el Diseño de Bloques al azar, ya que simultáneamente se pueden eliminar 
variabilidades procedentes de varias fuentes. Por ejemplo, supóngase que se 
planifica un experimento en maíz con tres híbridos diferentes: Arichuna, Obregón, 
FM6; siendo el FM6 el utilizado en la zona, esto es el considerado como testigo. 
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Los tratamientos pueden ubicarse consecutivamente de la manera siguiente: 


REP.I 


FM6 

OBREGON ARICHUNA 

REP II 

ARICHUNA 

FM6 OBREGON 

REP TTT 

OBREGON 

FM6 ARICHUNA 


No siempre los tratamientos van colocados en los bloques consecutivamente, 
como muchos experimentadores tienden a creer. Cuando el numero de trata¬ 
mientos es grande puede ser conveniente tratar de buscar, en lo posible, una 
forma cuadrada como la siguiente: 


T3 

T8 

TI 

T6 

T5 

T4 

T2 

T7 


La escogencia del tamaño del bloque puede variar dependiendo del tipo de 
investigación. El bloque en el campo puede ser colocado de manera tal que pueda 
tener cualquier número de tratamientos, sin embargo debe tomarse en cuenta que el 
error estándar por parcela aumenta sucesivamente con el incremento en el tamaño 
del bloque. Algunos autores piensan que en el sentido práctico en experimentos de 
campo, el número de tratamientos por bloques debe estar entre 2 y 20 máximo; las 
cifras mayores existen cuando hay gran uniformidad en el suelo. 

Existen otros diseños como los diseños de Bloques Incompletos en los que 
la idea esencial es reducir el número de tratamientos por bloque de tal manera de 
llevarlos al tamaño adecuado. 

Efecto de competencia y bordura: Cuando se planifican los experimentos, 
uno de los principios básicos que se toma en cuenta es el tratar de disminuir la 
variabilidad proveniente de algunos factores que se pueden controlar y que de no 
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hacerlo abultaría el error experimental y esto podría provocar que los efectos de 
los tratamientos no puedan ser claramente medidos. Uno de estos efectos, que 
debe ser tomado en cuenta, es el Efecto de Competencia y Bordura. 

Se puede definir como Competencia, la interacción que se presenta por el 
contacto directo de dos unidades experimentales vecinas que reciben tratamientos 
diferentes, esta competencia puede ser por espacio, agua, luz, nutrientes, entre 
otros; esto surge por la vecindad entre las plantas. En el caso de animales la 
vecindad puede provocar diferencias de salud, temperamento, comportamiento, 
hábitos. 

Se define como Bordura, la diferencia en comportamiento de las plantas 
ubicadas en los hilos externos del experimento de campo por estar en áreas no 
sembradas o cubiertas de malas hierbas o de otros cultivos. Para evitar estos 
efectos que provocan que el error experimental se abulte, generalmente se dejan 
hilos de Bordura. Estos hilos de bordura no se toman en cuenta en el análisis de 
los datos. Debido a eso se habla de parcela experimental la que incluye los hilos 
efectivos y los hilos de bordura y la parcela efectiva que incluye solamente los 
hilos efectivos. 

La American Society of Agronomy refiere lo siguiente, sobre los efectos de 
competencia y Bordura: “En la mayoría de los experimentos de suelo, en prueba 
de variedades y ensayos de prácticas culturales, la producción de las parcelas 
puede ser modificada por la continuidad de otros tratamientos y cultivos o espacios 
no cultivados entre las parcelas; la modificación consiste en el aumento de algunas 
producciones y las bajas de otras. Se ha realizado algunos experimentos para 
estudiar el efecto de la Competencia y la Bordura y gran parte de ellos llegan a 
la conclusión de tomar en consideración estos aspectos a la hora de planificar los 
experimentos”. 


Clasificación de las observaciones 

Se refiere como observaciones a las mediciones que se van a hacer en el 
experimento, estas observaciones pueden ser: 
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Observaciones Principales: Estas son las mediciones que van a servir 
para evaluar los tratamientos de manera de analizar los resultados, discutirlos, 
concluir y hacer las recomendaciones pertinentes. Todo esto con el fin de cumplir 
los objetivos previstos en el ensayo. 

En el caso de la Experimentación Agrícola Vegeyal, la medida mas común 
es el rendimiento; sin embargo, pueden tomarse otras mediciones principales 
con el fin evaluar los tratamientos. Por ejemplo en ensayos de frijol pueden tomarse, 
además, observaciones sobre el numero de vainas, longitud de las vainas, numero 
de granos por vaina, peso de las vainas, peso de los granos, entre otros. Estas 
observaciones son tomadas sobre la misma unidad experimental o sobre una 
muestra de la unidad experimental. 


Observaciones Auxiliares: Éstas se hacen principalmente con dos 
finalidades: 

- Disminuir el error experimental. 

- Encontrar una mejor interpretación de los resultados cuando los 

tratamientos son evaluados. 

Las medidas adicionales hacen posible presuponer, por lo menos hasta 
cierto punto, el comportamiento de las unidades experimentales. Por ejemplo, en 
un experimento para medir diferentes raciones alimenticias para animales, al 
comienzo del experimento, los pesos iniciales serían una medida adicional muy 
importante, ya que el incremento en peso de un animal durante el experimento, 
puede estar asociada al peso inicial. 

Mediante una técnica conocida con el nombre de Análisis de Covarianza, se 
puede estimar el grado en que las observaciones fueron influenciadas por 
variaciones de estas observaciones auxiliares. La respuesta promedio a cada 
tratamiento puede, por lo tanto, ser ajustada para disminuir el error experimental 
ocasionado por esa fuente de variación. 
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Ventajas y desventajas de los experimentos diseñados estadísticamente 

Las ventajas de los experimentos diseñados estadísticamente son: 

- Cuando el experimento es planificado estadísticamente es necesario 
una colaboración estrecha entre los estadísticos y el investigador con las 
consiguientes ventajas en el análisis e interpretación de resultados en las 
diferentes etapas. 

- Se hace énfasis en las distintas alternativas de planificación y por supuesto 
esto permite la producción única de datos útiles para el análisis e interpretación 
de resultados. 

- La atención debe centrarse también en las interrelaciones y la estimación 
y cuantificación de las fuentes de variabilidad de los resultados. 

- El número de análisis y pruebas de significación pueden determinarse 
con certeza y a menudo se pueden reducir. 

- La comparación de los efectos es más precisa debido a la tabulación y 
clasificación adecuada de los resultados. 

- La exactitud de las conclusiones se conoce con una precisión probabilisti- 
camente definida. 

Existen algunas desventajas al planificar los experimentos estadísticamente; 
sin embargo, son mucho menores. Ellas son: 

- Los diseños de los experimentos y su posterior análisis generalmente van 
acompañados de ciertos enunciados basados en el lenguaje estadístico, presentando 
para muchos investigadores cierta dificultad, por eso es conveniente que el esta¬ 
dístico traduzca a un lenguaje mas sencillo tales enunciados de manera que sea 
más entendible para el investigador. El estadístico no debe subestimar la importancia 
de la presentación de los datos en forma gráfica, pero siempre acompañado 
posteriormente por el procedimiento analítico. 

- Existen algunos diseños muy complicados y se han criticado no solamente 
por lo costoso y porque requieren mucho tiempo; sin embargo, no hay que 
olvidar que los diseños complejos son la respuesta a objetivos complejos; por 
consiguiente, es prudente recordar que el mejor diseño experimental a usarse en 
una situación particular es aquel que siendo el más sencillo permite alcanzar los 
objetivos planteados. 
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ANÁLISIS DE VARIANZA 


El análisis de V alianza, inspirado y desarrollado por R. A. Fisher y sus alumnos 
en el año de 1921, es un método de Estadística InductiVa válido para efectuar 
pruebas de significación entre dos o más series simultáneamente. 

Consiste en separar la variación total de un conjunto de observaciones 
medidas por la suma de cuadrados de las desviaciones con respecto a la media, 
en componentes asociados a fuentes definidas de variación, utilizada como criterio 
de clasificación para las observaciones. Esto indica que en realidad, el análisis de 
varianza es un análisis de sumas de cuadrados. 

El análisis de Varianza es usado para proveer soluciones a dos tipos de 
problemas fundamentales distintos. Por un lado, puede ser usado para detectar la 
existencia de relaciones fijas entre medias de una población y para estimar los 
parámetros que definen tales relaciones; y por otro lado, puede ser usado para 
detectar la existencia de componentes de variación y estimarlas. 


SUPUESTOS BÁSICOS EN EL ANÁLISIS DE VARIANZA 

Los supuestos básicos en el análisis de Varianza cuando se hacen pruebas 
de hipótesis son: 

- Los tratamientos y los efectos ambientales son aditivos. 

- Los errores experimentales son aleatorios y se distribuyen normal e 
independientemente en torno a una media cero y una varianza común. 

El supuesto de normalidad no es necesario para estimar los componentes 
de la varianza. Cuando el supuesto no se hace, es necesario que los errores no 
estén correlacionados en vez de ser independientes. En la práctica nunca estamos 
seguros de que todos los supuestos se cumplan, a menudo hay razón para creer 
que algunos son falsos.El incumplimiento de uno o más supuestos puede afectar 
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tanto el nivel de significancia como el de sensibilidad de F o t a las discrepancias 
reales respecto a la hipótesis nula.'En el caso de no normalidad, el verdadero 
nivel de significancia es corriente, pero no siempre mayor que el nivel aparente. 
Esto lleva al descarte de la hipótesis nula cuando no es verdadera con mayor 
frecuencia de lo que describe el nivel de probabilidad, en otras palabras, se presentan 
demasiadas diferencias significantes que no existen. Los experimentadores pueden 
pensar que están usando el nivel de significancia del 5% cuando en realidad el 
nivel puede ser de 7 u 8%. Se presenta pérdida de sensibilidad para las pruebas 
de significancia y la estimación dé efectos, ya que hubiera podido combinarse una 
prueba más poderosa si se hubiese conocido el modelo matemático exacto. Es 
decir, si se conociera la verdadera distribución de los errores y la naturaleza de los 
efectos, su aditividad o no aditividad, entonces podría construirse una prueba 
capaz de detectar o estimar efectos reales. 

Para la mayoría de los datos biológicos, la experiencia indica que las 
perturbaciones debidas a que los datos no cumplan los anteriores requisitos no 
son de importancia; sin embargo, hay casos excepcionales en que si lo son. En 
todo caso, la mayoría de los datos no cumplen exactamente con los requisitos del 
modelo matemático y los procedimientos de pruebas de hipótesis y de estimación 
de intervalos de confianza no deben considerarse exactos sino aproximados. 

Se ha señalado, que los errores experimentales deben tener una varianza 
común; por ejemplo, en un diseño completamente aleatorizado, las componentes 
del error proveniente de los diferentes tratamientos, deben ser todas las estimaciones 
de una varianza de población común. Aquí la heterogeneidad del error puede ser 
resultado del comportamiento errático de la respuesta a ciertos tratamientos. En 
experimentos como los destinados a determinar la eficacia de diferentes insec¬ 
ticidas, fungicidas o herbicidas, puede incluirse un control no tratado para medir 
el nivel de infestación y proporcionar una base para determinar la efectividad de 
los tratamientos. La variación de las observaciones individuales en el control de 
prueba puede ser considerablemente mayor que en los tratamientos, ante todo 
porque el control puede tener una media más alta y así, una mayor base de 
variación. En estas situaciones, el término de error puede no ser homogéneo. 
Un remedio para esto puede ser repartir el término del error en componentes 
homogéneos para probar comparaciones de tratamientos específicos. Algunas 
veces, si las medias de uno o dos tratamientos son mucho mayores que las otras 
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y tienen una variación significativa mayor, entonces tales tratamientos se pueden 
excluir del análisis. 

El que no se cumplan algunos de los demás supuestos puede dar lugar a 
heterogeneidad en el error experimental. Algunas sugerencias para solventar esta 
situación dependen de la naturaleza del no cumplimiento y pueden ser, por ejemplo, 
el uso de un tipo de transformación de los datos. 

Es deseable probar la homogeneidad de varianza por la misma razón que 
se prueba homogeneidad de medias o para establecer si se cumple o no el supuesto 
de homogeneidad requerido para el análisis válido de la varianza de los datos. Si 
se descarta la hipótesis de homogeneidad de la varianza, entonces es probable 
que se haga un análisis de varianza sobre datos transformados. 

Si se supone heterogeneidad de varianzas a partir de una prueba aplicada, se 
asume que las muestras se extraen de diferentes poblaciones. No se debe decir 
POBLACIÓN ya que, como las varianzas son desiguales, se evidencia que las 
muestras no provienen de una misma población muestral. 

Supuesto de normalidad 

La normalidad de los errores implica que el componente aleatorio de los 
tratamientos (error experimental) de un ensayo debe seguir una distribución 
simétrica cuando la distribución es normal. Las consecuencias de la no-normalidad 
de los errores no son demasiado graves. Únicamente una distribución muy 
asimétrica tendría un efecto marcado sobre eJLnivel de significación de la prueba 
F o sobre la eficiencia del diseño. La mejor manera de corregir la falta de 
normalidad es realizar una transformación que hará que los datos se distribuyan 
normalmente. Si una transformación simple no es suficiente habría que aplicar 
pruebas no paramétricas. 
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Se puede probar la normalidad por: 

* Prueba de Ji Cuadrado de Bondad de Ajuste: 

Esta prueba consiste en calcular un ^calculado P ara Hego compararlo con un 
Ztabuiado a un n ^ ve * significación prefijado con elfin de establecer si se rechaza 
o no, la hipótesis nula. Las hipótesis que se prueban para el caso de normalidad 
son: 


Ho : s nOOOo está distribuido NID (0, a 2 ) 
Ha : ¿r si está distribuido NID (0, o " 2 ) 


El estadístico de prueba es: 


Xcalculado 




(O r E¡)2 


(3.1) 


donde O; = frecuencias observadas 
E ; = frecuencias esperadas 

* Prueba de Wilk y Shapiro: 

Las hipótesis continúan siendo: 

Ho: No hay normalidad 
Ha: Si hay normalidad 

Para la verificación de la normalidad de la variable aleatoria especificada se 
seguirán los siguientes pasos: 

1) Se ordenan en forma creciente los datos de la variable objeto de estudio. 

íj<7 2 <-<7„ 

2) Se calcula la suma de cuadrados de las desviaciones de los datos de la 

variable respecto a su media. » 

S 2 =ZW-Y ) 2 

i= 1 
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3) Si n es par, n = 2k, calcule b con la siguiente ecuación: 

k 

b = Y J a n _ M (Y n _ M -Y k ) 

/=1 

4) Si n es impar, n = 2k + l,calcule¿conlasiguienteecuación: 

b = 2 a ÁY n -Y ] ) + -+a k+2 {Y k+2 -Y k ) 

5) Se calcula W — —y 

S 2 

6) Se obtiene el W-tabulado (Ver Tabla A) , con un nivel de significación de 
a (en la tabla se busca 1- a) 

7) Si el W-calculado > W-tabulado; se rechaza la hipótesis nula en favor de 
la alternativa, con lo cual se estima que hay normalidad. 


Ejemplo de aplicación de la prueba de Wilk y Shapiro 


Sea el siguiente conjunto de datos compuesto de doce observaciones, en los 
cuales se quiere establecer si provienen de una población distribuida normalmente 
o no. Los datos se presentan en la Tabla 3.1. 
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Tabla 3.1. Tabla de Resultados para la Prueba de Wilk - Shapiro 

i 

Y, 

original 

Y. 

ordenados 

a n-i+l 

Y . ,-Y. 

n-i+1 i 

a n, +1 CY n . ¡+1 -Y : ) 

1 

11,2 

11,2 

0,5473 

13,3 

7,2791 

2 

14,5 

13,2 

0,3325 

9,3 

3,0923 

3 

17,2 

14,5 

0,2347 

6,7 

1,5725 

4 

17,8 

14,8 

0,1586 

5,2 

0,8248 

5 

19,3 

16,9 

0,0922 

2,4 

0,2213 

6 

24,5 

17,2 

0,0303 

0,6 

0,0182 

7 

21,2 

17,8 

0 

-0,6 

0 

8 

16,9 

19,3 

0 

-2,4 

0 

9 

14,8 

20,0 

0 

-5,2 

0 

10 

20,0 

21,1 

0 

-6,7 

0 

11 

13,2 

22,5 

0 

-9,3 

0 

12 

22,5 

24,5 

0 

-13,3 

0 

Total 




b - 13,0082 


CALCULOS 


Y « 





/12 = 17,7583 


12 _ 

= 171,3885 

/=] 


K alc = 


s 2 


(13,0082) 2 

171,3885 


= 0,9873 


W lalt = 0,979 conn~ 12 y a = 0,05 
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Conclusión: Como el W-calculado > W-tabulado, se descarta Ho en favor 
de Ha, por lo tanto se asume que existen evidencias suficientes para suponer la no 
violación del supuesto de normalidad. 

Esta prueba puede ser llevada a cabo a través del uso de la computadora y 
los paquetes estadísticos más comunmente usados, entre ellos el S AS o el Statistix. 
En estos casos además de obtener el valor del estadístico correspondiente se tie¬ 
ne la probabilidad de significancia que al compararla con el a seleccionado per¬ 
mitirá concluir si se rechaza o no la hipótesis nula. Usualmente también se presenta 
un gráfico en el cual si se observa la presencia de una recta es indicativo de nor¬ 
malidad. Es de notar que usualmente un acercamiento a la normalidad es consi¬ 
derado suficiente para el cumplimiento del supuesto. 

Supuesto de aditividad 
Prueba de Turkey 

Mediante el cumplimiento de este supuesto cualquier valor único observado 
puede descomponerse en componentes aditivas que representan los efectos de 
tratamiento así como un término especial aleatorio. Una comprobación de este 
supuesto requiere más de una simple observación por casilla, o bien el cálculo 
independiente del cuadrado medio del error a partir de experimentos previos 
equiparables. 

Si el efecto es multiplicativo en vez de aditivo se encontraría que la suma de 
cuadrados de interacción aumentaría debido a la no aditividad de los efectos de 
tratamiento. En este caso transformando la yariable se conseguirá restablecer la 
aditividad de los datos. 


La no aditividad ocurre si los efectos principales están hechos por algún 
proceso como multiplicación, también ocurre cuando alguna observación se 
entremete accidentalmente de una población diferente de las que se están 
investigando, y también si la varianza heterogénea pide medias ponderadas y, 
finalmente si existen efectos (interacciones) además de los efectos principales y el 
error. 
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El método de prueba para la hipótesis de aditividad queda explicado por 
medio del siguiente ejercicio: 

Los datos de la tabla 3.2 corresponden a las observaciones del efecto de 5 
dosis de fertilizantes sobre la altura de plantas de pimentón al momento de 
transplante; en un diseño en bloques al azar. 


Tabla 3.2. Datos y resultados para el análisis del supuesto de aditividad 


TRAT/ 

BLOQ 

1 

2 

3 

4 

5 

7, 

Yj - Y - d, 

1 

16,80 

14,20 

9,60 

15,2 

16,4 

14,44 

-1,51 

2 

16,60 

20,80 

11,00 

15,8 

17,6 

16,36 

0,41 

3 

19,80 

23,75 

11,00 

12,6 

16,2 

16,67 

0,72 

4 

17,40 

21,20 

12,25 

13,2 

17,6 

16,33 

0,38 

Y, 

17,65 

19,98 

10,96 

14,2 

16,95 

15,95 


y, -y =c, 

17 

4,0375 

-4,9875 

-1,75 

LO 



P. 

l 

2,306 

12,242 

2,589 

- 2,386 

0,0804 




Los cálculos serían; 

Pj = 16,8x(-l,51) + 16,6x(0,41) + 19,8x(0,72) + 17,4x(0,38) = 2,306 
P, = 14,2x(-l,51) + 20,8x(0,41) + 23,75x(0,72) + 21,2x(0,38) = 12,242 

P 5 = 16,4x(-l,51) + 17,6x(0,41) + 16,2x(0,72) + 17,6x(0,38) = 0,0804 

=3,111 = 48,1291 

P = ^CíPí = 1,7x2,306 + 4,0375x12,242-4,9875x2,589 + 
1,75x2,386 + 1,0x0,0804 = 44,6905 
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SCNoAditividad = - 


44,6905 


13,775 


(EcfXZdf) 3,111x48,1291 

Por lo tanto el ANAVAR sería de la manera presentada en la tabla 3.3. 


Tabla 3.3. ANAVAR que ilustra la prueba de Tukey 


F.deV. G.deL. 

S.C. 

C.M. 

F 

P 

Trat 4 

192,516 

48,129 

10,52 

0,0003 

Error 15 

68,639 

4,576 



Prueba de Tukey 

No Adit. 1 

13,339 

13,775 

3,51 

0,0818 

Residuo 14 

54,864 

3,919 



Total 19 

261,155 





El F calculado de la no-aditividad (3,51) es menor que el F tabulado, 
a = 0,05 con 1 y 14 grados de libertad (4,6) lo que quiere decir, que no hay 
evidencias suficientes para rechazar la hipótesis nula, lo cual indica aditivividad 
de los efectos. 


Homogeneidad de varianzas 

La igualdad de varianzas, como hemos visto, en un grupo de muestras es 
una condición importante para varias pruebas estadísticas. Un sinónimo para 
esta condición es la homogeneidad de varianzas u homocedasticidad. El término 
homocedasticidad proviene del Griego y significa igualdad de dispersión, la 
condición inversa (desigualdad de las varianzas de algunas medias muéstrales) es 
llamada heterocedasticidad. 

La homocedasticidad puede alcanzarse asignando aleatoriamente los 
tratamientos, pero esto solamente algunas veces no basta, ya que puede haber una 
respuesta diferente de las unidades experimentales con distintos tratamientos. Esta 
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situación puede presentarse al evaluar el efecto de distintas dosis de fungicidas o 
herbicidas que además incluyen un control. Una posibilidad es separar los 
tratamientos que tienen varianzas semejantes y separarlos de los otros al hacer el 
análisis. 

Cuando los datos se alejan de cualquiera de estos supuestos, es posible, en 
algunos casos, realizar un cambio de escala en la presentación de los resultados de 
manera de ajustarse a las condiciones impuestas para que el ANAVAR pueda 
aplicarse y el comportamiento de-la variable estudiada se ajuste al modelo lineal. 
Para los tipos de desviaciones más comunes existen transformaciones. 

Pruebas de Homogeneidad de Varianzas: De tiempo en tiempo nos 
hemos preguntado si dos o más cuadrados medios difieren significativamente. 
Para dos cuadrados medios se obtiene una respuesta mediante el uso de la prueba 
de F de dos colas, que se estudia en Estadística General, pero para el caso de más 
de dos medias, hay varios procedimientos y pruebas que se tratarán a continuación. 


Pruebas Gráficas: 

Análisis de Gráficos de residuales: Si el modelo es correcto y si se 
comprueban los supuestos, los residuales no deben tener estructura; en particular 
, ellos no deben estar correlacionados con ninguna otra variable incluida la respuesta 
Y j . Un simple chequeo es el gráfico de residuales contra valores fijos se Y ¡¡ . 
Este análisis puede no revelar ningún patrón aparente. La figura 3.1 es un gráfico 
de residuales contra valores fijos para los datos de la Tabla 3.4. 
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Tabla 3.4. Fuerza de tensión en varias fibras sintéticas (Ib/in) 


Observaciones 


% de algodón 

1 

2 

3 

4 

5 

Y. 

15 

7 

7 

15 

11 

9 

49 

20 

12 

17 

12 

18 

18 

77 

25 

14 

18 

18 

19 

19 

88 

30 

19 

25 

22 

19 

23 

108 

35 

7 

10 

11 

15 

11 

54 


376 = Y.. 



Figura 3.1. Gráfico de residuales contra valores fijos. 
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Algunas veces la varianza de las observaciones aumenta cuando crece la 
magnitud de las observaciones. Este puede ser el caso si el error es un porcentaje 
constante del tamaño de la observación (esto comúnmente sucede con muchas 
medidas de instrumentos en que el error es un porcentaje de lectura). Si es este el 
caso, los residuales mostrarían el corte transversal de un embudo. Las varianzas 
heterogéneas también se evidencian en casos en que los datos siguen una 
distribución distinta a la normal y/o una distribución asimétrica, en distribuciones 
asimétricas la varianza tiende a ser función de la media. Respuestas incorrectas al 
tratamiento también puede causar desigualdad en las varianzas. 

Si el supuesto de homogeneidad es violado, la prueba de F se afecta solo 
ligeramente en el modelo balanceado de efectos fijos. Sin embargo, diseños mal 
balanceados o en casos en que una varianza es mucho mayor que las otras, el 
problema es más serio. Para el modelo de efectos aleatorios, varianzas de errores 
diferentes pueden afectar significativamente las inferencias sobre los componentes 
de varianza, aun si se utilizan en diseños bien balanceados. 

Una propuesta usual al tratar con varianzas no constantes es aplicar una 
transformación estabilizadora de varianzas, luego se efectúa el análisis de la varianza 
sobre los datos transformados. Se debe notar que las conclusiones de este análisis 
de varianza se aplican a las poblaciones transformadas. 

Se ha investigado mucho acerca de la selección de una transformación 
apropiada. Si las observaciones de los experimentos de prueba siguen 
distribuciones teóricas, se puede utilizar esta información para la selección de una 
transformación. Por ejemplo si las observaciones siguen la di stribuc ión Poisson, 
una distribución de raíz cuadrada Y¡j * = ^jY¡- ó Y ¡j = 1 + Y¡. pueden ser 

usadas. Si los datos siguen una distribución logarítmica, entonces la transformación 
V = lo § Y (/ es apropiada. Para datos binomiales expresados como fracciones 
la transformación Yg* = arcsenY,-,- es usada. Cuando la transformación no es 
clara, el experimentador usualmente busca en forma empírica una transformación 
que iguale las varianzas haciendo caso omiso del valor de las medias. En 
experimentos factoriales, otra salida es seleccionar una transformación que 
minimice la interacción de varianzas, resultando en un experimento que sea fácil 
de interpretar. 
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Selección de una transformación estabilizadora de varianzas: Si los 
experimentadores supieran las relaciones que hay entre las varianzas de las 
observaciones y las medias, podrían usar esta información para guiarse en la 
selección de una transformación. Ahora se trabajará sobre este punto y se probará 
como es posible estimar la forma de la transformación requerida por los datos. 

Sea E(Y) = n la media de Y, y suponga que la desviación estándar de Y es 
proporcional a una potencia de la media de Y, tal que: 

o- Y ce ¡x (3.2) 

a 

Se quiere encontrar una transformación para Y que haga la varianza constante. 
Suponga que la transformación es una potencia de los originales, esto es: 

Y* = Y X (3.3) 

en la que puede ser probado que: 


X+a-1 


(3.4) 


Claramente si hacemos V=l-a entonces la varianza de los datos 
transformados Y* es constante. 

Varias de las transformaciones más comunes están resumidas en la Tabla 
3.5.NotequeX = 0 implica la transformación logarítmica. Estas transformaciones 
están ordenadas según su incremento de fuerza. Por la fuerza de la transformación 
queremos significar la cantidad de curvatura que induce. Una transformación 
ligera aplicada a unos datps que abarcan un rango estrecho tiene poco efecto en 
el análisis, de la misma forma que una transformación fuerte aplicada en datos de 
rango amplio puede tener resultados dramáticos. 
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Tabla 3.5. Transformaciones estabilizadoras de varianzas. 


Relaciones entre 
cr Y y p 

a 

X=l-a 

Transformación Notas 

cr Y oc constante 

0 

1 

No hay 

g y cc p 1/2 

1/2 

1/2 

Raíz cuadrada Datos de Poisson 

g y ocp 

1 

0 

Logaritmo 

ct y oc p “ 

3/2 

-1/2 

Raíz cuadrada recíproca 

a Y oc p 2 

2 

-1 

Recíproco 


Selección empírica de a: En muchas situaciones de diseño experimental 
en los que hay réplicas se puede hacer una estimación empírica de a para los 
datos. Ya que en la combinación del tratamiento i-ésimo 

c Y¡ oc p,“ = 9 p,” (3.5) 

donde 0 es una constante de proporcionalidad, tomando logaritmos obtenemos: 

log Cf Y . = log0 + a logp. (3.6) 

Por lo tanto un gráfico de loga yj contra logp. debería ser una recta con 
pendiente a. Como no se conoce cj y¡ y ¡a se puede sustituir estimaciones 
razonables de ellas y usar la pendiente de la línea ajustada como una estimación de 
a. Se puede usar la desviación estándar S. y el promedio Y. del tratamiento 
i-ésimo para estimar cr Y . y p.. 

Ejemplo del uso de transformaciones estabilizadoras de la varianza. 

Un ingeniero civil está interesado en determinar si cuatro métodos diferentes 
para determinar el fluido de barro producen estimaciones equivalentes de descarga 
máxima, cuando es aplicado a un mismo canal de descarga. Cada procedimiento 
es usado seis veces en el mismo canal de descarga y el resultado de los datos de 
descarga (en pies cúbicos por segundo) aparecen en la tabla 3.6. 
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Tabla 3.6. Descargas máximas. 


Métodos de 
estimación 


Observaciones 

Y. 

i. 

s ¡ 

1 0,34 

0,12 

1,23 

0,70 1,75 

0,12 0,71 

0,66 

2 0,91 

2,94 

2,14 

2,36 2,86 

4,55 2,63 

1,09 

3 6,31 

8,37 

9,75 

6,09 9,82 

7,24 7,93 

1,66 

4 17,15 

11,82 

10,95 

17,20 14,35 

16,82 14,72 

2,77 

El análisis de varianza de los datos, totalizado 

en la tabla 3.7, implica que 

hay una diferencia entre las medias 

máximas de descarga dadas por 

los cuatro 

procedimientos. 






Tabla 3.7. Análisis de Varianza para los datos de descargas máximas. 

Fuentede 


Grados de 

Suma de 

Cuadrados 


Variación 


libertad 

cuadrados 

medios 

Fe 

Tratamiento 


3 

708,3471 

236,1157 

76.07 

Error 


20 

62,0811 

3,1041 


Total 


23 

770,4282 




El gráfico de residualeycontra valores fijos que se muestra en la Figura 3.2 
es problemático, ya que la forma en embudo del corte transversal implica que el 
supuesto de homogeneidad de varianzas no se cumple. 
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■ 0,2 • 
0,4 
■ 0,6 


Figura 3.3. Gráfico de LnY.contra LnS.. 


43 








La pendiente de la línea recta que pasa por estos puntos se corta para Vi y 
de acuerdo con la tabla 3.5, esto implica que la transformación de raíz cuadrada 
puede ser apropiada. El análisis de la varianza para datos transformados Y* = 
VF es presentada en la tabla 3.8 y su gráfico de residuales en la figura 3.4. 

Tabla 3.8. Análisis de la varianza para los datos de descarga máxima transformada 

Y *= VF 


Fuente de 
Variación 

G. de L. 

Suma de 
Cuadrados 

Cuadrados 

medios 

Fe 

Tratamiento 

3 

32,6842 

10,8947 

76,99 

Error 

19 

2,6884 

0,1415 


Total 

22 

35,3726 





A 

L 


Figura 3.4 Gráfico de residuales para los datos y * 

Estos residuales están mucho más dispersos que en la figura 3.2, por lo que 
se concluye que la transformación de raíz cuadrada ha sido útil. Notar que en la 
Tabla 3.8 se han reducido los grados de libertad en uno para tomar en cuenta el 
uso de los datos para estimar el parámetro a de la transformación. 
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PRUEBAS ANALÍTICAS DE HOMOGENEIDAD 
DE VARIANZAS 

Además de los gráficos de residuales que se utilizan frecuentemente para 
diagnosticar desigualdad de varianzas, se han propuesto varias pruebas estadísticas. 
Estas pruebas pueden ser vistas como pruebas formales de la hipótesis: 

} -O: o\ = <x 2 = = of 

Ha: al menos una de las of es distinta de las demás. 

Prueba de Bariett: Es un procedimiento de prueba aproximado 
ampliamente usado. El mismo es una modificación de la prueba de razón de 
verosimilitud de Newman-Person. Esta prueba permite detectar si se cumple el 
supuesto de homogeneidad de varianza, y aunque tediosa por la cantidad de 
cálculos involucrados, es relativamente sencilla de aplicar y debe utilizarse siempre 
que se sospeche que el conjunto de datos a analizar puede estar violando este 
supuesto. 

Para aplicar la prueba deben calcularse las varianzas dentro de cada tratamiento 
que no necesariamente debe ser igual. A partir de ellos se construye una tabla que 
ayuda a ordenar los cálculos necesarios para evaluar un valor de ^ calculado) 

que se compara con un valor tabulado. Si el valor calculado resulta menor que el 
tabulado para un nivel de significación predeterminado, la diferencia entre las 
varianzas es atribuida al azar y se declara no significativa; de lo contrario, si es 
mayor el % 2 que el tabulado, la diferencia entre las varianzas de los distintos 
tratamientos es significativa y debe realizarse una transformación en los datos 
originales antes de proceder al ANAVAR. 

El procedimiento comprende el cálculo de un estadístico cuya distribución 
muestral se aproxima mucho a la distribución de % 2 , con a-1 grados de libertad, 
donde a es el número de varianzas bajo estudio. Estas varianzas provienen de 
muestras independientes extraídas de una población normal. El estadístico de 
prueba es: 

x ] = LnlO (q/c) = 2,3026 (q/c) (3-7) 
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donde q y c se definen como: 

q = (n - a) log S 2 p -Z (n. - 1) log Sf (3.8) 

c = 1 + [1/3(a - 1)]{X (m -1) 1 - (n - a )' 1 } (3.9) 

S 2 P = Z (n. -1) Sf / (n-a) (3.10) 

donde Sf es la varianza muestral de la i-ésima población. 

La cantidad q es grande cuando las Sf difieren grandemente y es cero 
cuando todas ellas son iguales. Asi, se puede rechazar Ho basándose en valores 
muy grandes de %f . En otras palabras, se rechaza Ho solamente cuando 

xl>xl,a-\ (3.11) 

donde X a ;a-\ es e l percentil superior de valor a de la distribución de ^ con 
a-1 grados de libertad. 

Vanos estudios han indicado que la prueba de Barlett es muy sensible al 
supuesto de normalidad y no debe ser aplicada cuando este supuesto está en 
duda, pues para usar apropiadamente esta prueba se supone que las distribuciones 
de base son normales. Cuando esto no ocurre, la prueba puede detectar la no 
normalidad en vez de la heterogeneidad de varianzas. Esta prueba es más sensible 
a la no normalidad que el uso de F en el análisis de varianza. 
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EJEMPLOS DE APLICACIÓN DE LA PRUEBA DE 
HOMOGENEIDAD DE VARIANZAS DE BARLETT 

Ejemplo 1 

Dadas cinco varianzas: Si 2 =11,2; S2 2 = 9,8; S 3 2 =4,3; S4 2 =6,8 ; 
S s 2 =8,2 provenientes de muestras de tamaño 5 todas ellas, entonces: 

S P 2 = [4(11,2) + 4(9,8) + 4(4,3) + 4(6,8) + 4(8,2)] / 20 = 8,06 
q = 20 log 8,06 - 4(log 11,2 + log 9,8 + log 4,3 + log 6,9 + log 8,2) = 0,45 

c = 1 + [l / 3(4)][5 / 4 -1 / 20] = 1,10 

y el estadístico de prueba es: 

X =2,3025(0,45/1,10) = 0,93 

El valor tabulado corresponde a Zo.os-a = 9,49 . Como z] es menor 
que Zo 05-4 entonces no podemos rechazar Ho y concluimos que las varianzas 
son homogéneas. Esta es la misma conclusión a que se llega por el análisis del 
gráfico de residuales contra valores fijos. 

Ejemplo 2 

Si tenemos estimaciones §i 2 cada una con un número de grados de libertad 
f (igual número de observaciones fueron usadas para cada estimación) el criterio 
de prueba es: 

M = 2,3026 f (a logS 2 - X lo gS 2 ) donde S 2 = X s ? / a 

El factor 2,3026 es una constante. Bajo la hipótesis nula en que cada s¡ 2 
es una estimación del mismo ¿j 2 la cantidad MI c se distribuye normalmente 
con una z 2 con a- 1 grados de libertad donde: 

c = 1 + (a- 1) / 3af 
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En estos casos c es siempre ligeramente mayor que 1, y es necesario usarla 
únicamente si M está cerca de los valores críticos de % 2 . 

En la tabla 3.9 se aplica la prueba de varianza de gramos de factores 
absorbidos en los cuatro tipos de factores. Aquí a = 4yf=:5.El valor de M 
es 1,88 lo cual claramente no es significativa con tres grados de libertad. Para 
ilustrar este método % 2 = M/ c = 1,74 ha sido calculado. 


Tabla 3.9. Cálculo de la Prueba de Barlett cuando todas las estimaciones tienen 
cinco grados de libertad. 


Factores 

Si 2 

logjS/ 2 

1 

178 

2,2504 

2 

60 

1,7781 

3 

98 

1,9912 

4 

68 

1,8325 

Total 

404 

7,8522 


S 2 = 100,9 /ogS 2 =2,0038 

M = 2,3026(5)[4(2,0038)-7,8522] = 1,88 
c = 1 + [ (a+1) / 3 a f ] = 1 + 5 / 3 (4) 5 = 1,083 
Z 2 = 1,88/1,083 = 1,74 

Se concluye que no se rechaza Ho a un nivel de significancia de 0,05 y con 3 
grados de libertad. 

Cuando los grados de libertad difieren, como con muestras de tamaños 
diferentes, el cálculo de % 2 es más largo y se realiza de la siguiente manera: 
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M = 2,3026 filogS 2 - Z fi.logS?) donde S 2 = 2>s*/Zf, 
c = 1 + [l / 3(a- l)][E(l/fi)-(l/E^ 

zl — M/ c con a— 1 grados de libertad. 

Ejemplo 3 


(3.12) 

(3.13) 

(3.14) 


En la tabla siguiente se aplica la prueba de varianzas a los pesos al nacer de 
cinco camadas de cochinos. Como g 2 es la varianza combinada (ponderada 
según los grados de libertad) necesitamos una columna para la suma de cuadrados. 
En el calculo de c se usará también una columna con los recíprocos de los grados 
de libertad (1 / f¡) . Los cálculos dan valores a zl = 16,99 con 4 grados de 
libertad, probando que las varianzas difieren de camada a camada en estos datos. 


Tabla 3.10. Calculo de la Prueba de Barlett para homogeneidad de varianzas. 
Muestras de diferentes tamaños. 


Camada 

SC 

g.del. 

CM 




(muestra) 

£ S, 2 

f 

S. 2 

1 

log S. 2 

fi log Si 2 

1/f. 

1 

1 

1,18 

9 

0,909 

-0,0414 

0,3726 

0,111 

2 

3,48 

7 

0,497 

-0,3060 

-2,1252 

0,1429 

3 

0,68 

9 

0,076 

-1,1192 

-10,0728 

0,1111 

4 

0,72 

7 

0,103 

-0,9872 

-6,9104 

0,1429 

5 

0,73 

5 

0,146 

-0,8357 

-4,1785 

0,2000 

sumatoria 

13,79 

37 



-23,6595 

0,7080 


¡i 2 = 13,79/37 

(X fí-logS 2 )=37(-0,4286) = -15,8582 
M=2,3026[-15,8582-(-23,6595)]=17,96 
c =l+[l/3(4)][0,7080-1/37]=!,057 
X] = M/ c =17,96/1,057=16,99 
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al comparar con el valor tabulado, con 4 grados de libertad, no es significativo 
con un nivel de significancia de 0,01; lo cual es indicativo de homogeneidad en las 
varianzas. 

Cuando alguno o todos los Sf son menores que 1, como en el caso de 
estos datos, es de notar que no se altera si todos los S 2 y todos los g 2 son 
multiplicados por un mismo número (digamos 10 ó 100); esto permite evitar 
logaritmos negativos. 

Ejemplo 4 

La prueba de homogeneidad de varianzas de Barlett se efectúa en los datos 
de un estudio sobre la herencia del tamaño de la semilla de lino; en el cual el 
experimentador (Myers) obtuvo la varianza de los pesos de grupos de 50 semillas 
provenientes de plantas individuales de padre y de la generación Fl. Si se usan 
logaritmos naturales (con base e), no se requiere el factor 2,3026; éste sólo se 
emplea cuando se usan logaritmos decimales. Los datos y el cálculo del estadístico 
de la prueba de Barlett aparecen a continuación en la tabla 3.11. 


Tabla 3.11. Prueba de Homogeneidad de Varianzas. 


Clase 

G .de L. 

2>-t) 2 

S, 2 

HSf 

(n-l)logS ; 2 

l/(n-l) 

Redwíng 

81 

4.744,217 

58,57 

1,76768 

143,18208 

0,01235 

Ottawa 770B 

44 

3.380,96 

76,84 

1,88559 

82,96596 

0,02273 

Fl 

13 

1.035,71 

79,67 

1,90129 

24,71677 

0,07692 

Totales 

138 

9.160,84 



250,86481 

0,11200 




66,38 

1,8204 

251,44152 


Z 2 = 2,302 


l)logS 2 -I(n¡- 

l)logS? 

jdonde 




S 2 =Z(ni--l)Sf/X(ni-l) 

% c~ 2,3026(251,44152 - 250,86481) = 1,3279 con dos grados de libertad 
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Factor de corrección = 1 + [l / 3 (k - l)]|^[l / ( n¡ - 1)] — 1 / ^.(wí — 1)| 

= 1 + [l / 3(2)]{o,l 1200 -1 /138} = 1,01746 
ZÍrregido = 1,3279 /1,01746 = 1,305 No significante 


El factor de corrección deberá mejorar la aproximación de cuando los 
tamaños de la muestra son pequeños. Es siempre mayor que 1 y su uso disminuye 
el valor bruto de % 2 . Así generalmente calculamos el zlorreguio s °l° cuando el 
% 2 bruto es significante pero está cercano al valor crítico. 

El valor tabulado para con dos grados de libertad (igual al número de 
tratamientos menos uno) y con probabilidad de 95% es 5,99. Como el valor 
calculado es 1,305 (menor que el valor tabulado) es posible atribuir al azar las 
diferencias entre las varianzas de los tratamientos y hacer un ANAVAR con los 
datos originales. 

Los valores independientes de ^ son aditivos, o sea que la distribución de 
una suma semejante se distribuye como % 2 con un número de grados de libertad 
igual a la suma de los grados de libertad de los sumandos. Esto es válido sólo 
para los % 2 sin corregir, pero no para los corregidos. Así que si se tuvieran varianzas 
de varios años, podría ser informativo hacer comparaciones entre y dentro de 
años. T am bién si se dispone de las varianzas de varias generaciones en segregación, 
podemos hacer comparaciones entre padres y F1 (como en el ejemplo) entre 
generaciones y segregación y entre los dos grupos. El % 2 total puede usarse, al 
menos como comprobación aritmética. 

Cabe señalar que esta prueba requiere que se cumpla el supuesto de 
normalidad, si esto no se cumpliera y se hubiera realizado un muestreo de una 
población que no se distribuye normalmente, la prueba detecta esta falta de 
normalidad. El inconveniente reside en que la prueba de Barlett es más sensible 
que la prueba F del ANAVAR para detectar la falta de ajuste a la normalidad. 
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Prueba de Cochran: La prueba de Cochran (“The distribution of the largest 
of a set of estimated variances as a fraction of their total, Ann Eugen, 11:47- 
52(1941)) consiste en calcular S^ ax / Z S? . 

Sean S¡ para i=l,2,...k; el conjunto de varianzas que son estimadores 
independientes de af respectivamente, cada una está basada en n variables 
aleatorias independientes normalmente distribuidas. Sea 

k 

g = maxS 2 /Zs 2 (3.15) 

el radio del mayor s 1 en el conjunto total de varianzas muéstrales. La hipótesis 
Ho: er, 2 = er 2 =...= cr 2 es aceptada si 

S —8a (3.16) 

donde g a esta dada en las tablas B y C con un nivel de significancia oc igual a 
0,05 o 0,01. Las tablas tienen enteros con n, el número de observaciones por 
grupo y k el número de varianzas que han sido consideradas. 

Prueba de Pearson y Hartley: Pearson y Hartley (1954) proponen una prueba 
en la que se calcula la razón / S 2 mn , en la cual se considera el cociente entre 

la mayor y la menor varianza de las muestras. Los autores proporcionan unas 
tablas especiales. Esta prueba aparece como una alternativa, puesto que la 
aproximación a la % 2 es menos satisfactoria si la mayor parte de los grados de 
libertad (n¡— l) de cada muestra son menores que 5. Es una prueba rápida, un 
poco menos simple que la prueba de Barlett. En Biometrika, Tables for 
Statisticians, Third edition, Cambridge, New York, 1966, aparecen tablas de valores 
críticos para realizar la prueba. 

La Fmax puede ser usada como una prueba corta de heterogeneidad de 
varianzas. Sean S 2 para i = 1,2,...,k, el conjunto de varianzas que son estimadores 
independientes de cr 2 , cada una basada en v grados de libertad y ordenadas en 
forma ascendente de magnitud. Entonces: 

lo gc( S max /S min) = l0 ge S max ~ lo g E S^ n = rangO(log e Sj ) (3.17) 
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donde log c S 2 se aproxima a una distribución normal con media log e cr 2 y 
varianza 2/(v-l), puntos percentiles para S^ ax/ S^ in pueden ser calculados 
aproximadamente para los puntos correspondientes a los percentiles de los rangos 
en pruebas normales. Las tablas D y E se calculan para puntos correspondientes 
a los extremos de los porcentajes 5% y 1% superiores. „ 

Una aplicación del Fmax propuesto por Pearson y Hartley para los datos 
de la tabla 3.9 será: 


Fmax =(SL”/SL)= 178/60 = 2,97 (3.18) 

Cada varianza muestral tiene cinco grados de libertad, basándose en esto, se 
busca el valor tabulado para un nivel de significancia de 0,05 por ejemplo, y 
resulta ser 13,7; de donde se desprende que para este ejemplo las varianzas son 
homogéneas. En el caso en que el tamaño de las muestras sea diferente, se toma 
el menor de los grados de libertad de las varianzas empleadas en el cálculo de 
Fmax. 

Tanto la prueba de Barlett como la de Pearson y Píartley son sensibles a la 
no normalidad de los datos, particularmente a la kurtosis. Con distribuciones 
platicurticas, la prueba da veredictos erróneos acerca de la heterogeneidad de 
varianzas. 
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DISEÑO EXPERIMENTAL COMPLETAMENTE 
ALEAT ORIZADO 


Introducción 

Es el diseño experimental más sencillo y se origina por la asignación aleatoria 
de los tratamientos a un conjunto de unidades experimentales previamente 
establecidas. En este diseño puede probarse cualquier número de tratamientos 
resultando deseable, aunque no esencial, asignar el mismo número de unidades 
experimentales a cada tratamiento. 

Es un diseño de mucha utilidad en todos los campos de la ciencia, siempre 
y cuando se consiga homogeneidad del material experimental y del mismo sitio 
donde se vaya a desarrollar el experimento. Se podrían enumerar una serie de 
ventajas y desventajas del diseño. 

Ventajas del Diseño Experimental Completamente Aleatorizado: 

- Tanto la planificación como el análisis son los más simples si se les compara 
con los otros diseños conocidos. 

- Produce el máximo número de grados de libertad para el error 
experimental, lo que es muy útil en pequeños ensayos. 

- Cuando existe un número desigual de replicaciones por tratamiento no es 
causa de complicaciones en el análisis estadístico. 

- Es de fácil manejo en el campo y en el laboratorio. 
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Desventajas del Diseño Experimental Completamente Aleatorizado: 

- Sólo puede usarse con material experimental homogéneo. 

- Su utilidad es muy restringida en los experimentos de campo, debido a la 
heterogeneidad del suelo, que se conoce puede ser muy .grande y para evitar que 
la misma enmascare los resultados del experimento, debe recurrirse a diseños 
más eficientes. 

- Presenta desventajas cuando el material es heterogéneo, ya que no se puede 
aumentar mucho el tamaño del experimento, ya que esto motiva variaciones altas 
que enmascaran el efecto del experimento. 

En cuanto al número de observaciones para cada tratamiento o factor se 
determina en base a los costos y a la potencia de la prueba. 

El Modelo Lineal Aditivo 

El modelo lineal aditivo para este diseño es: 

+ e Lj (4.1) 

para i= 1, 2,... t j=l,2,...r 

Y.. representa la j-ésima observación del i-ésimo tratamiento, por 

ejemplo Y 23 representa la tercera observación del tratamiento dos. 

H es el efecto común de todo el experimento, es decir la media 

poblacional. 

r. representa el i-ésimo tratamiento. 

s. . denota el error aleatorio presente en la j-ésima réplica del i-ésimo 

tratamiento. 

Se considera que e.. se distribuye normal e independientemente (NTD) con 
media cero y varianza &■■ esta es una varianza común para todos los tratamientos. 

e¡j ~ NID(0,a 2 ) (4.2) 
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y es un parametro fijo y r. se consideran también parámetros fijos si los 
tratamientos son fijos, que en ese caso se hace el supuesto siguiente: 

t 

¿ f ¡ = 0 (4.3) 

Si los t tratamientos son elegidos al azar, se asume que r. se distribuye 
normal e independientemente con media cero y varianza er 2 .. 

t. ~ NID(0, d x .) ( 4 . 4 ) 

El hecho de que los tratamientos sean fijos o aleatorios, depende de como 
son elegidos en un experimento dado. 

El análisis de un diseño completamente aleatorizado para un solo factor 
consiste de un análisis de varianza con un criterio de clasificación, probándose la 
hipótesis nula: 


Ho: t. - 0 ( 4 . 5 ) 

para toda i probada. Si la hipótesis nula es verdadera, no existe efecto de 
tratamiento y cada observación Y., proviene de una población con media // y 
un efecto aleatorio s. 


Análisis de Varianza 

Para la revisión de la prueba F, se realiza en un análisis de varianza con una 
sola vía de clasificación con j; grupos o tratamientos. Considérese la siguiente tabla 
(Tabla 4.1) en la que se muestran las observaciones. 
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Tabla 4.1. Ordenamiento de los datos con las medias de tratamiento para el 
Análisis de Varianza. 


Tratamiento 

1 

2 

Observaciones 

... j 

n 


Medias 

1 Y „ 

Y u 

Y . 

Y ,f 


f 1 ,. 

= Y 21 

Y u 

Y , 

Y . 

A 

^2. 

i Y il 

Y 2 

Y.. 

>j 

Y, 

H 

l 

E, 

t Y tl 

Y ,2 

Y . J 

Y m 

1 

fC 


Cada observación puede ser tomada de cada tratamiento, se nota que puede 
haber un número infinito de datos tomados de cada tratamiento. La esperanza 
matemática de cada tratamiento es: 


E(Y lj )= (i, =(i + x, 
E ( Y 2j)= h=l l + X 2 


E(Y (j )= p,=p + T, 


(4.6) 


// representa el promedio para todos los tratamientos por consiguiente 

Eoy = „ 

En el modelo, el efecto de tratamiento se puede indicar como (jU { - (X), de 
esta forma el modelo se puede escribir de la forma siguiente: 
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Y..— lt + T. + s.. 

>J " ■ IJ 

Y ¡j= M- + (f 1 -M-) + ( Y ¡j' H,) 

Y u - M = -h)+ ( Y r m.) 


(4.7) 
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Si las medias son desconocidas, entonces se toman muestras aleatorias de 
observaciones de los tratamientos y se puede hacer una estimación de las medias 
de los tratamientos y de la media poblacional. Si se toman n ; observaciones de 
los tratamientos en los que el número de observaciones no es necesariamente 
igual se podría representar de la manera siguiente; (Tabla 4.2). 

Tabla 4.2. Muestra para el ANAVAR con un solo criterio de clasificación. 


Tratamiento Observaciones 

1 2 ... n. Total Media n. 

1 1 


1 


Y b 

Y, n , 


A 

n ,. 

2 


Y* 

y m 



n 2. 

i 

y n 

Y i2 

Y.. 

mi 


1 

i. 

"i. 

t 

y, 

Y e 

Y „ 

¿Y, 

1 

n 

t. 


Aquí Y. representa el total de las observaciones tomadas del tratamiento 
“i” y n- representa el número de observaciones del mismo tratamiento y E. es la 
media del referido tratamiento. Y., representa el total de todas las observaciones. 


/ ni 

Y.. - I I 

/=1 jM 


Y. 


= ' n. = n 


■i “i + n 2 + ... + n 


(4.8) 

(4.9) 


63 



Dr. FrankÜn Chacin 


Si Y.. es la media de las n observaciones, entonces: 

í 

Y.. = Z n¡ Y. / n (4.10) 

í=i 1 1 

Si esos estadísticos muéstrales sustituyen a los correspondientes parámetros 
poblacionales, la ecuación que se generaría sería la siguiente: 

Y ;j - Y.. = (Y. - Y..) +(Y..- Y.) (4.11) 


Esta ecuación se establece con base en las desviaciones de las observaciones 
con respecto a la media general y pueden dividirse estas desviaciones en dos 
partes, las desviaciones de la media de cada tratamiento con respecto a la media 
general más las desviaciones de cada observación con respecto a la media de 
cada tratamiento. 


Si ambos lados de la ecuación anterior son elevados al cuadrado y sumados 
en “i” y en “j”, resulta: 

t ni t ni t n ‘ l 

Z Z ( Y ; . - Y..) 2 = Z Z (Y,.-Y..) 2 +Z Z (Y ;j - Y ; ) 2 


1=1 y=i 

t ni 


i=l i -1 


2Z Z (Y. -Y..) (Y..- Y.) 


i=i y=i 


Examinando el último término del lado derecho de la ecuación. 


t ni t 

Z Z (Y l -Y..)(Y - "y. )= Z V, -y..) 

i=l j= I 1=1 


z 


y=i 


(V Y,) ] 

(4.12) 


la parte que se encuentra entre los corchetes es igual a cero ya que representa la 
suma de todas las observaciones con respecto a la media dentro de cada 
tratamiento. Por consiguiente: 
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t ¡ ni 

X -1 X~' _ 1 ' u , t m 

- Y -) 2 = S 2 (Y¡. -Y..) 2 +X X (Y..- Y. y 

1=1 /=l j =i , = i _,=i 11 L ' 


(4.13) 


, . La ecuacló n anterior se puede referir como la ecuación fundamental en el 
análisis de la varianza y expresa la idea de que la suma de cuadrados de todas las 
desviaciones de las observaciones con respecto a la media general es igual a la 
suma de cuadrados de las desviaciones de la media de tratamiento con respecto 
a la media general mas las desviaciones de cada observación con respecto a la 
media de cada tratamiento. La manera de obtener estimadores insesgadas de la 
varianza poblacional sería la siguiente: 



(Y¡j " Y-) 2 - SCTOTAL dividido por los grados de libertad (n-l)(4.14) 


Si la hipótesis que se va a probar en el análisis de varianza es verdadera, 
entonces r. = 0 para toda i, es decir, no hay efecto de tratamiento, esto es; 


^i. = M y - = A, 

por consiguiente el modelo estaría formado solo por la media poblacional más 
el efecto aleatorio. 


Y = p + E. 

U r y 

luego uno sólo de los tres términos de la ecuación anterior puede usarse como 
estimador msesgado de la varianza poblacional. Por ejemplo, si se divide el término 
del lado izquierdo de la ecuación por los grados de libertad (n-1) se produciría 
un estimador insesgado de layarianza poblacional. 

(Y ;j - Y¡ ) 2 dividido por (£n. - 1) 

Si las varianzas dentro de los t tratamientos son estadísticamente iguales, 
entonces se estimarán por agrupamiento: 
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t m 

n ^¡i- y ,) 2 

í=l 7=1 “ 


divididos por los grados de libertad respectivos, calculados de la siguiente manera: 



y así se obtendría la estimación de la varianza poblacional. Así también pueden 
hacerse estimaciones de la varianza a 2 y entre las medias formadas déla 
población con a 2 y = n¡ a 2 un estimador insesgado para o 2 y es dada por 
y 1 n. (Y. - Y..) 2 / (t-1) el cual se encuentra sumando el primer 


í=i 

término de la parte derecha de la ecuación 4.13 sobre “j” y dividido por (t -1) 
grados de libertad. De esta forma existen tres estimadores insesgados de a 2 
cuando la hipótesis nula es verdadera. Los tres estimadores son independientes y 
las sumas de cuadrados aditivas. Sin embargo se puede mostrar que si cada término 
de la suma de cuadrados es dividida por los respectivos grados de libertad, 
entonces se producirían dos distribuciones independientes que son estimadores 
insesgados de a 2 cuando Ho es verdadera. Si dos de tales estimadores 
independientes son comparados, la razón puede demostrarse que tiene una 
distribución F con (t -1) y (n - 1 ) grados de libertad dada por: 


(Y L —Y) 2 /(t-l) 
F(t-l;n-t)= ni - 

IIíY-YpPC'-t) 

i=l j=l 


CMTRAT 

CMEE 


(4.15) 


La región crítica se toma de la tabla en la que aparece la distribución de F, 
rechazando Ho si Fcal > Ftab (1 - a) donde a es el área de F, a . Si F es significativa 
indicaría que existen diferencias entre las medias de los tratamientos y por lo tanto 
la hipótesis nula es rechazada. Estimadores insesgados de la varianza, es decir, la 
suma de cuadrados entre los grados de libertad son también referidos como 
cuadrados medios. En la tabla 4.3 se dá el esquema de ANAVAR. mostrando los 
grados de libertad y las sumas de cuadrados respectivos. 
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Tabla 4.3. ANAVAR del Diseño Completamente aleatorizado. 


Fuente de Variación 

F. de V. 

Grados de libertad Suma de Cuadrados 

G. de L. S. de C. 

Tratamiento 

t- 1 

t 

Z n i (Y i -Y..) 2 
, Í=1 

= X Yd/ni - Y.. 2 /n 

1*1 

Error 

Z ( n ; 
/=1 

i ni 

- 1) Z Z (y - y . y 

/=i y-i J 



/ «/ í 

= Z Z Y 2 - Z Y. 2 /n. 

i=i r=i i=i 

Total 

t », 

i = l 

/ ni 

- 1 Z Z (Y - Y..) 2 

1=1 7=1 ■ 

f «í 

= Z Z Y. 2 - Y.. 2 / n 

M M " 
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Esperanza de los Cuadrados Medios: 
El Modelo Lineal Aditivo es: 


Y ..= p + x ¡ + 8, (4.16) 

La suma de cuadrados de tratamiento de acuerdo a la Tabla 4.3 es: 

i 

SCTRAT = Z n. (Yi.-Y..) 2 

1=1 1 


del modelo (4.16) 

n ni 

Y . = Z Y. / n = Z 


y=i 


j =i 


(M + F + e ¡¡) /n 


ni 

Y. = (n U / n) + (n X. / n) + Z 

'■ ' j =i 


s.. / n 

■i 


H. = p + T¡ + 


z 

;=i 


8. / n 
y 


También: 

t ni t ni 

Y- — Z Z K/nt= Z Z (P + T.+ £.. ) / nt 

i=i y=> J i=i y=i 1 ,J 


(4.17) 


Y.. = (nt p /nt)+ (nZ 


X. / nt) + 


z z 


j= 1 


8 .. / nt 
y 


/ / «í 

Y.. = p + Z x. /t + Z Z 8 .. / nt 

i=l ’ i=l 7=1 ' J 
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restando delaecuación4.17laecuación4.18. 


j i ni 

h -y..) 2 = ( *, - Z x. /t y + i / n 2 ( Z e „ - Z Z 


Z_J t. /t Y + 1 / n 2 ( Zw s - 7 , Zj e.. / t ) 2 + 

/=i y=i iEt m " 


productos cruzados 


Suma de Cuadrados de tratamiento: 


SCTRAT = 'Yj «(£[ -S .) 2 = n Z 


¿-J ( X, - x. /t Y + 

/=! i=i 


• /.■I <Z s,-Z Z 


/-I 7=1 


S¡j / t ) 2 +n productos cruzados 


El valor esperado será: 


E(SC TRAT )= n E f'Yj ( r¡ - Z /t 
1 = 1 ‘ 1=1 


nE[É (X 


¿Z V /t ) 2 ]+ 1 / nE[ ( Z^ E.. - 
1=1 1=1 7=1 J 


Z I 8. / t ) 2 


/=! 7=1 


ya que se puede demostrar que el valor esperado de los productos cruzados es 
igual a cero. 


Z r-Z 

1=1 1=1 


(j-0 -40 = 0 
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luego la E(SC TRAT) = = «Z V +(nt-n)/n a 2 c 

1=1 

t 

si los errores son aleatorios y Z 2 es una constante, 
SC TRAT / (t-1) M 

**** 

así; 

t 

E(CMTRAT) = »H t . 2 / (t-l) + [n(t - l)/n (t-1) ]o 2 s = 

í=i 


Si los tratamientos son aleatorios y su varianza es 
E(CM TRAT) =na\+ 

Cuadrado medio del Error. 

i " 

SC ERROR = Z 2 (Y..-Y;) 2 
1=1 >1 

Sustrayendo las ecuaciones 4.16 y 4.17 


Y - 


y 



S../n 

u 


elevando al cuadrado y sumando 



la E(CM TRAT) = 


nZ x. 2 /(t-l)+ o». 


(4.22) 
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El valor esperado será: 

t n n 

E(SCERROR) = eX 2 ( S - X S. /n) 2 
<=i y=t iJ y=i ,J 


t n n 



t 

= X (n- l)cr 2 = t (n- 1 )ct 2 e 

/=! 


E (CMEE) = E [ SCEE /1 (n -1)] = (4.24) 


(4.23) 


Complementando la tabla 4.3 del Análisis de Varianza, vease la siguiente 
Tabla 4.4. 
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Y.. - es el valor de la variable de respuesta en la j-ésima repetición del i-ésimo 

tratamiento. 

p. = son parámetros 

son independientes N(0, a 2 ) i = 1,, r j = l,... n 


Aspectos importantes del modelo Tipo I 

1) Los valores observados de Y en la j-ésima repetición del tratamiento i- 
ésimo es la suma de dos componentes: el término constante p. y el 
término aleatorio del error s... 

1J 

2) Como E(e..) = 0, se tiene que E(Y..) = p.. Por lo tanto todas 
las observaciones para el i-ésimo tratamiento tienen la misma esperanza 

h- 

3) Como p. es una contante se tiene que ct 2 (Y ) = a 2 (e. ) = a 2 por lo 
tanto las observaciones tienen la misma varianza, para cualquier tratamiento. 

4) Como cada 8. está distribuido normalmente Y r tiene la misma 
distribución. Esto es debido a que Y., es una función lineal de 8 

5) Los errores se asumen independientes; esto es, el término del error en 
una salida no tiene efecto en el término de error de otro resultado. Si los 
errores son independientes así también son las observaciones Y... 

6) En virtud de estos,aspectos en el modelo planteado se puede establecer 
que: Y. están independientemente distribuidos N(p., a 2 ) 

Nota: El modelo de análisis de varianza es un modelo lineal porque puede ser 

expresado matricialmente en la forma: Y = X[3 + 8. 
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Por ejemplo en el caso de dos tratamientos con dos observaciones cada uno, Y, 
X, P y 8 se definen como sigue: 



'10 0 " 
1 o o 
0 1 o 
x_ 0 1 0 
0 0 1 
0 0 1 



Note la estructura simple de la matriz X y que el vector P consiste en una 
matriz de medias. 

Modelo Tipo II (Efectos aleatorios) 

El análisis de varianza para el modelo II es de la forma: 



Y.. — es el valor de la variable de respuesta en la j-ésima repetición del i-ésimo 
tratamiento. 

Li. = son independientes N ( p , o 2 ) 

8.. son independientes N(0, CT 2 ) i = 1, ... ,r j = 1,... n. 
p¡ y S-j son variables aleatorias independientes. 

El modelo II es similar en apariencia a los modelos de efectos fijos. La 
principal distinción es que para el modelo I el factor de medias p. es constante, 
pero son variables aleatorias para el modelo II. Por lo tanto el modelo II es 
llamado el modelo de los efectos aleatorios. 
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Aspectos importantes del modelo Tipo II. 

1) El valor esperado de una observación Y., es E(Y.) = p, esto se debe 
a que E(Y j .) = E(p.) + E(s..) = p + 0 = p. Note que la esperanza toma 
promedios tanto para p. como para e.. 

2) La varianza de Y es: ct 2 (Y..)= cr 2 u + a 2 esto resulta porque modelo II 
supone que p. y e'l son variables aleatorias independientes y a 2 (p¡)= cj 2 u 
Y a ' 2 ( e ij ) ==c5 ' 2 - Debido a que la varianza de Y en este modelo es la suma 
de dos componentes a 2 u y a 2 , este modelo es algunas veces llamado 
modelo de componentes de varianza. 

3) Finalmente, los Y están normalmente distribuidos porque son una 
combinación lineal de las variables p. y s los cuales son independientes 
y normales. Sin embargo, los Y., no son independientes debido a que un 
número de diferentes Y., tienen el mismo componente p, 

Comparación entre los modelos Tipo I y Tipo II 

En el modelo I, las conclusiones que se generan son pertinentes a solo 
aquellos tratamientos incluidos en el estudio. En el modelo II, las conclusiones se 
extienden a la población de tratamientos de los cuales los tratamientos en el estudio 
son una muestra. La diferencia principal entre las dos situaciones es la siguiente: 

El Modelo I, es relevante cuando los tratamientos son escogidos porque 
existe particular interés en ellos y no son considerados como una muestra de una 
población mas grande. El Modelo II, es apropiado cuando los tratamientos 
constituyen una muestra de una población y el interés está en el estudio de los 
tratamientos. 
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EJEMPLO ILUSTRATIVO 


En la siguiente tabla (Tabla 4.5) se presentan los resultados (rendimiento 
en Kg/parcela de 3 m 2 ) de un ensayo con cuatro variedades de pepino. 


Tabla 4.5 Datos en el ejemplo ilustrativo de un diseñpcompletamente aleatorizado. 


Observaciones 

(r) 

1 

VARIEDADES (k) 

2 3 

4 

1 

4,87 

2,30 

6,80 

1,28 

2 

4,60 

2,25 

5,70 

3,88 

3 

1,33 

5,85 

4,62 

5,00 

4 

5,58 

6,16 

3,80 

3,25 

5 

5,88 

8,35 

2,75 

1,56 

6 

2,81 

5,93 

4,93 

4,25 

7 

4,10 

1,50 

4,93 

4,46 

8 

5,63 

5,85 

3,80 

5,53 

Total 

34,80 

38,19 

37,33 

29,21 


k = 4 = número de variedades. 

Ellas son: l.-Marketer; 2.-Ashley; 3.-Pixie; 4.-Poisett 
r = 8 = número de observaciones por variedad 
n = 32 = número total de observaciones. 

1. Modelo Lineal Aditivo: 


Y ,r» +T , + e t 

i = 1,2,... ,t j = 1,2,... ,r 

Y.. = observación j-ésima del i-ésimo tratamiento. 

/j = media general. 

r¡ = efecto del i-ésimo tratamiento. 

<SV = error experimental de la j-ésima observación en el i-ésimo tratamiento. 
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2. Supuestos del Modelo: 
Modelo I 

X x, = 0 
1 = 1 

e.. ~ NID(0 ,g 2 ) 
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Modelo II 
t. ~ NID (0, a 2 ) 

X 

6, ~NID(0,a 2 ) 


3. Hipótesis: 
Modelo I 
Ho: T. = 0 

l 

Ha: X ^ 0 

I 


Modelo II 
Ho: a 2 =0 

T 

Ha: a 2 0 


4. Esquema del Análisis de Varianza: 
Ver Tabla 4.6 
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Tabla 4.6. Esquema del Análisis de Varianza para un diseño completamente 
aleatorizado 


F.deV 

G.del. 

Suma de cuadrados Cuadrados Medios 

Esperanzas de los Cuadrados Medios 
Modelo Fijo Modelo Aleatorio 

M(I) M(II) 

Trat 

t-l 

t 

Y.*Ir - F.G. SC TRAT /t-l 

i=l 

t 

r y' . x . 2 / (t-l) + o 2 e o 2 t + a 2 g 

i=l 

Error 

t(r-l) 

Diferencia SCEE / t(r -1) 

a 2 ct 2 

s e 

Total 

rt - 1 

t ni 

¿ X y 2 -f.c. 

1=1 j= 1 




t ni 

F.C. = X S Y.. 2 /rt = (5L) 2 /n 

Í=1 7=1 ' J 



5. Desarrollo del Ejemplo: 


Suma de Cuadrados 

Sumade Cuadrados de Tratamiento: 

34,80 2 + 38,19 2 + 37,33 2 + 29,2 1 2 139,5 2 


SCTRAT = ---- 6,139 

8 32 

Sumade Cuadrados Total: 


SCTOTAL = 4,87 2 + 4,60 2 + ... + 4,46 2 + 5,53 2 - 139,5 2 / 32 = 92,569 
Suma de Cuadrados del Error Experimental: 

SCEE = SCTOTAL - SCTRAT = 86,457 
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Cuadrados Medios o Varianzas 
Cuadrado Medio de Tratamiento: 

CMTRAT = SCTRAT /(t -1) = 2,0463 


Cuadrado Medio del Error Experimental: 
CMEE = SCEE / t (r - 1) = 3,0877 


Análisis de Varianza (ANA VAR) 


Fuentede 

Variación 

Gradosde 

libertad 

Suma de 
Cuadrados 

Cuadrados 

medies 

Fe 

Tratamiento 

3 

6,139 

2,0463 

0,662 

Error 

28 

86,457 

3,0877 


Total 

31 

92,596 




Prueba de Hipótesis 

Fe = CMTRAT / CMEE = 0,662 

Ft = —-r- 


cr 
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Para probar la hipótesis compare el F calculado (0,662) con el F tabulado, 
éste se encuentra en la tabla de F con los grados de libertad del numerador 
(tratamiento) y los grados de libertad del denominador (error experimental) y 
con un nivel de significación y probabilidad de cometer el error tipo I. 

Ftab (3,28,0,05) = 2.95 Ftab (3,28,0,01) = 4,57 

Fcal = 0,662 es menor que cualesquiera de los dos Ftab a los distintos niveles de 
significación considerados. 

Interpretación: 

De acuerdo a los resultados se puede establecer que F no es significativa, 
por lo tanto, no se rechaza la hipótesis nula, es decir, Ho: T. = 0. Esto se puede 
interpretar como que no hay diferencias entre los tratamientos (variedades) 
estudiadas; los rendimientos promedios correspondientes a las variedades de 
pepino fueron estadísticamente iguales. 
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EJERCICIOS 


Con un conjunto de datos afín a su investigación, responda las siguientes 
preguntas: 

- Establezca el modelo lineal aditivo describiendo cada uno de los 
términos del modelo y los sub-índices presentes. 

- Dé los supuestos del modelo. 

- Establezca las hipótesis a probar. 

- Escriba el cuadro de ANAVAR de acuerdo al modelo. Considere 
cuadrados medios esperados y los estadísticos de prueba. 

- Realice el ANAVAR. 

- Pruebe las hipótesis. 

- Interprete los resultados. 
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DISEÑO COMPLETAMENTE ALEATORIZADO 
CON SUBUNID ADES EN LAS UNIDADES EXPERIMENTALES 
- SUBMUESTREO - 

Muchas veces no basta con tomar un elemento por unidad experimental 
debido a que se incrementa grandemente el coeficiente de variación; por tanto, 
existen procedimientos en los que se determina el tamaño óptimo de la unidad 
experimental. Se pueden variar las^combinaciones de número de réplicas y el 
tamaño de la unidad experimental con el fin de disminuir la variabilidad, expresada 
usualmente a través del coeficiente de variación. 

Cuando se tienen las unidades experimentales compuestas de varios 
elementos, se pueden segqir tres procedimientos: 
a.- Tomar un promedio 
b- Totalizar 

c.- Tomar información de cada elemento individual, con el 
procedimiento que se describirá a continuación. 

/.- Modelo Lineal aditivo 

^=^ +T ¡ +s o + K ( 4 - 25 ) 

i =1,2,... ,t j = 1,.2,..., r k=l,2,... ,m 

S = efecto del error experimental 
8. v = efecto del error de muestreo 

ijk 
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II.- Supuestos 

Modelo I 

Modelo II 

Yj t. = 0 

/= I 

T j ~ NID (0. <j\) 

£¡j ~ NID (0, a 2 e ) 

s, ~ NID (0, CT 2 e ) 

5 ijk ~NID(0, a 2 g ) 

8, jk ~ NID(0,cT) 

III.- Hipótesis 


Modelo I 

Modelo II 

Tratamiento: 


Ho : X . = 0 

1 

Ho: CT 2 =0 

1 

Ha: X. ^ 0 

I 

Ha: CT 2 

X 

Error. 


Ho: a 2 =0 

Ho: a 2 =0 

£ 

8 

Ha: CT 2 * 0 

Ha: cr 2 


e e 


IV.- Prueba de F 

F C TRAT > F tab ( a,t - l,t(r - 1)) Se rechaza Ho 
F C TRAT < F lab (a,t - 1 ,t(r - 1)) No se rechaza Ho 

F C EE > F tab ( a,t(r - 1), tr(m - 1)) Se rechaza Ho 
F C EE < F lab (a,t(r-X),tr(m- 1)) No se rechaza Ho 
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Si la prueba de F para el Error Experimental es significativo, la prueba de 
F para tratamiento se divide entre el cuadrado medio del Error experimental; 
pero si no es significativo se debe hacer un pool de errores, adicionando las 
sumas de cuadrados y dividiendo entre las sumas de los grados de libertad de los 
dos errores y el FTRAT será CMTRAT / CMEE(conjunto). 


Ejemplo Ilustrativo 

Este ensayo fue realizado en los campos experimentales del CENIAP para 
evaluar el efecto de la fertilización sobre la producción de follaje en el cultivo de 
maíz. El área foliar se midió en base al peso seco. El diseño experimental que se 
utilizó en el ensayo fue el de bloques al azar, tomando muestras de dos plantas 
dentro de cada unidad experimental, ya que la medición del área foliar por este 
método es muy laboriosa para hacerlo en todas las plantas y se consideraba que 
dos plantas representarían una muestra apropiada de la población en cada unidad 
experimental. Sin embargo, para fines de ejercicio, el ensayo será analizado como 
un D iseño CornpktamenteAleatorizado con Submuestreo. 

El modelo se considera fijo, ya que las dosis de fertilizantes utilizadas se 
consideran como una población y los resultados obtenidos a partir de estas dosis 
no pueden ser extrapolados a otros tratamientos o dosis. 

I.- Modelo Lineal aditivo 


Y. = u + x. + £.. + 8.., 

i= 1,2,..., t j = 1,2,..., r k = 1, 2 ..., m 

= efecto del Error Experimental 
8 = efecto del error de muestreo 
r = número de repeticiones por tratamiento 
m = número de muestras por unidad experimental 
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z 


1=1 


T. = 0 


Ey ~ NID(0 ,ct 2 ) 
£ 


III.- Hipótesis 

Ho: X j = 0 Ho: a 2 =0 

E 

Ha: X. 0 Ha: a 2 ^ 0 


IV.- Análisis de los Resultados. 
Vease Tabla 4.7. 


5 ¡jk ~NID(0,a 2 ) 

5 
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Tabla 4.7 Datos en el ejemplo ilustrativo de un diseño completamente aleatorizado 
con submuestreo 

Tratamiento 


Observaciones 


Total 

1 

6240,70 

5499,90 

6355,44 

5634,58 



5746,64 

6336,64 

6822,10 

7612,56 

50248,56 

2 

8865,02 

7437,97 

8171,28 

8677,62 



10263,24 

9288,72 

6093,54 

7720,01 

66517,40 

3 

7403,04 

8537,94 

7734,78 

7734,78 



7123,68 

5993,94 

6569,33 

9236,34 

60333,83 

4 

10458,54 

9484,52 

9515,70 

8223,66 



8960,72 

7214,72 

7577,64 

7820,80 

69256,30 

5 

8511,75 

6809,40 

6828,11 

8511,75 



8956,98 

7865,87 

8771,03 

6477,66 

62732,55 

6 

7811,90 

9973,15 

9248,34 

9207,24 



8503,02 

5296,20 

9847,44 

6966,54 

66853,83 

7 

6382,60 

5825,82 

9804,88 

9256,13 



10056,96 

8684,05 

6468,26 

8125,80 

65494,96 

8 

8855,22 

8338,90 

6920,71 

9166,50 



9550,62 

5971,32 

9035,55 

4923,72 

62762,54 

9 

6728,82 

9551,65 

9288,71 

9998,17 



10056,96 

9166,50 

7093,13 

6420,00 

68243,94 

10 

8503,02 

7865,87 

9026,82 

7077,12 



10166,09 

7422,25 

7857,00 

6440,56 

64358,73 

11 

6479,25 

7071,30 

5584,51 

8830,88 



7384,42 

7950,54 

7106,72 

7623,47 

58031,09 

TOTAL 






183899,65 

167587,17 

171661,02 

171685,89 

694833,73 
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Análisis de Varianza 

F.deV 

G. de l. 

Suma de cuadrados 

Cuadrados Medios 

ECM 

F 

Entre 

tr-1 

l r 

Y Vm- F.C. 





Unidad 


Í= 1 j= 1 





Experi- 

= 43 

- 77608543 





mental 







Trata- 

t -1 

y, Y.Vrm-F.C. 

SCTRAT/t-1 

t^g +mo 2 t 

,+ CMTRAT/CMEE 

miento 




t 

mr / 1 t ( 
/=1 




= 10 

= 37019293 

= 3701929,30 

7/(ti) 

= 3,010 

Error 

t(r-l) 

SC(EUE) - Sctrat 

SCEE/t(r-l) 

c^g +mo 2 g 

CMEE/CMEM 

Experi- 







mental 

- 33 

= 40589250 

= 1229977,27 



= 0,592 

Error de 

n - tr 

SCTotal - Sctrat- SCEE 

SCEM / (n - tr) 

& 



Muestreo 

- 44 

= 91398328 

= 2077234,73 




Total 

n- 1 = 87 

t r m 

i I Z v 

í=i j= i *-i 

-F.C - 169006871 




t r m 

P.C-S I I 

1=1 i =1 k =1 

Y^ 2 / trm = (694833,73)7 88 

= 5486294457 





Suma de Cuadrados entre Unidades Experimentales: 

t r 

SC(EUE) = Z Z Y. ■/ m - F.C. 

/=i ’• 

SC(EUE) = [(6240,70 + 5746,64) 2 + (5499,90 + 6336,64) 2 + ... + (8830,88 + 
7623,47) 2 ] / 2 -F.C. 


SC(EUE) = l,1127806x!0 10 /2 -5486294457 = 77608543 
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Suma de Cuadrados de Tratamiento: 

l 

SCTRAT =2] Y. 2 /rm-F.C 
1=1 l - 

SCTRAT = (50248,56) 2 + (66517,40) 2 +.. .+(58031,1 

8 

SCTRAT = 5523313750-5486294457 = 37019293 

Suma de Cuadrados del Error Experimental: 

SCEE = SC(EUE) - SCTRAT 

SCEE = 77608543 - 37019293 = 40589250 


Suma de Cuadrados del Total: 


SCTOTAL 


t r m 

-II I 

i= 1 j =I k =1 


Y. 


,]k 


F.C. 


SCTOTAL = 5655301328-5486294457 = 169006871 


Suma de Cuadrados del Error de Muestreo: 
SCEM = SCTOTAL-SCTRAT-SCEE 


2 

--5486294457 


SCEM = 169006871 - 37019293 - 40589250 = 91398328 
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Prueba de Hipótesis 

Para Tratamiento: 

Fcal = 3,010 Ftab = 2,12 (10 gl, 33 gl, 0,05) 

Ftab = 2,49 (10 gl, 33 gl, 0,01) 

Para el Error Experimental: 

Fcal = 0,592 Ftab = 1,72 (33 gl, 44 gl, 0,05) 

Ftab = 2,15 (33 gl, 44 gl, 0,01) 


Coeficiente de Variación 


JCMEM -^2077234,73 

CV(M)= — -*100 = — - —xlOO = 18% 


Y general 


7895,84 


4CMÉÉ _ ^1229977,27 

CV(EUE) = —--xlOO = xlOO = 7% 


Y VE 


15791,68 


Interpretación de Resultados 

La prueba de F para tratamiento muestra un valor altamente significativo 
por lo que se rechaza la hipótesis nula (Ho: T. = 0) en favor de la hipótesis alterna 
(Ho: r^0)lo que indica que por lo menos un tratamiento tuvo efectos diferentes 
a los demás. En este sentido también se puede observar que el C.V. entre unidades 
experimentales fue relativamente bajo, permitiendo confiabilidad en los resultados 
obtenidos. Por ende, se puede afirmar que al menos una de las dosis de fer tilizan te'; 
utilizadas provocó una producción promedio de follaje en la planta de maíz 
diferente a las otras dosis. 
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Por otra parte la prueba de F para el error experimental arroja valores no 
significativos y menores que uno. Por lo tanto no se rechaza la hipótesis nula (Ho: 
Oy =0) y se concluye que la varianza del error de muestreo y la varianza del Error 
Experimental son estadísticamente iguales y están siendo estimadas por oh. Esto 
indica poca heterogeneidad en el muestreo y complementado con el hecho de 
que el coeficiente de variación es relativamente bajo, afirma aun más la conclusión 
de que el muestreo fue adecuado. 
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Capítulo 5 


DISEÑO EXPERIMENTAL EN BLOQUES ALEATORIOS 
O BLOQUES AL AZAR 

Introducción 

Los bloques al azar o bloques aleatorios constituyen el diseño de mayor 
importancia en la planificación experimental estadística. La utilización de este 
diseño conduce a utilizar los tres principios fundamentales del diseño estadístico: 
a) Aleatorización, b) Replicaciones, c) Control Local. 

La aleatorización se cumple al asignar los tratamientos a las unidades 
experimentales de cada bloque, de tal manera que todos los tratamientos estén 
representados en cada uno de ellos; esto en sí constituye una restricción en la 
aleatorización en comparación con el diseño completamente aleatorizado. 

Las replicaciones se cumplen ya que cada bloque representa una repetición 
de cada tratamiento y el Control Local con el bloqueo o agrupamiento de las 
unidades experimentales en los bloques de tal manera de extraer del error 
experimental la variabilidad de cualquier factor medida a través del bloqueo. 

Para que el experimento sea eficiente, deberá cada bloqueo ser lo mas 
uniforme, ya que el error se mide con base en la variabilidad aleatoria dentro 
del bloque. 

El diseño permite realizar un análisis de varianza para datos que pueden ser 
clasificados bajo dos criterios. La disposición en bloques aj azar es recomendable 
en la práctica, cuando se hacen.comparaciones en las que el número de tratamientos 
van desde 4 hasta 24. Puede ser muy útil en ensayos de campo, umbráculos, 
ganadería, economía, entre otros. 

Si se utiliza cuando el número de tratamientos es menor que 4, el número de 
repeticiones tendría que ser grande, generalmente mayor que 6, para poder tener 
suficientes grados de libertad para el error y poder estimarlo eficientemente. Es 
de recordar que en la práctica, es conveniente que los grados de libertad del 
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error sean mayores de 10, aunque esto depende de la homogeneidad del material 
experimental. 

Utilizar el diseño cuando hay más de 24 tratamientos es hasta cierto punto 
ineficiente y poco práctico, ya que puede existir heterogeneidad dentro de las 
repeticiones, es decir, entre las unidades experimentales, que hace aumentar 
grandemente el error. 


Disposición Experimental 

Es condición principal que todos los tratamientos formen bloques aleatorios; 
esto es, cada tratamiento debe estar representado una sola vez y aleatorizado en 
cada bloque. En cuanto al número de repeticiones es conveniente que oscile 
entre 4 y 12 dependiendo de: 

- La relación directa entre precisión y número de repeticiones: si se necesita 
más precisión se aumenta el número de repeticiones. 

- La heterogeneidad: entre mayor la heterogeneidad del material 
experimental mayor el número de repeticiones. 

- Número de tratamientos: entre mayor el número de tratamientos menor 
puede ser el número de bloques. 

- Tamaño de la unidad experimental: entre mayor sea el tamaño de la 
unidad experimental menor puede ser el número de repeticiones. 

Por consiguiente es conveniente encontrar la mejor relación entre estos 

factores. 
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Ventajas y desventajas del diseño experimental 
en bloques al azar 

Es el diseño mas utilizado en la investigación agrícola ya que permite controlar 
un factor de variabilidad, además de ser un diseño muy flexible desde el punto de 
vista de su análisis así como cuando hay parcelas perdidas o covariables para 
ajustes en el análisis de varianza. 

En cuanto a sus desventajas principales, se puede mencionar que cuando las 
condiciones son homogéneas los grados de libertad para el error experimental 
son menores que los del completamente aleatorizado y por consiguiente es menos 
precisa la estimación del Error Experimental. Otra desventaja es que cuando se 
usa un gran número de tratamientos las variabilidades dentro del bloque se pueden 
elevar de tal manera que el diseño se hace poco eficiente. 


Modelo Lineal en el Diseño en Bloques al azar 

El modelo de componentes de variación que describe la respuesta obtenida 
a través de un diseño en Bloques al azar es: 

K=p + Ti+P j+ 8 y (5.1) 

para i= 1,2,... t j = 1,2,... r 

Y., representa la j-ésima observación del i-ésimo tratamiento, 
fl es el efecto común de todo el experimento o media poblacional. 

T. son los efectos ó desviaciones debidas al i-ésimo tratamiento. 

es el efecto o desviaciones debidas al j-ésimo bloque. 

£ „ es el efecto del componente aleatorio en la j-ésima observación del 
i-ésimo tratamiento. 
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Efecto del tratamiento y bloques fijos 

Se considerará el bloque fijo como una medida para desarrollar la teoría 
que sustenta el modelo matemático de componentes de variación , así mismo 
para el desarrollo posterior de los modelos mixtos y aleatorios, (Hernández, A. y 
E. Soto, 1986). 

Ene i caso del Modelo I la población de tratamientos se puede considerar 
dividida en sub-poblaciones independientes y cada observación Y.. , 
correspondiente a cada sub-población es una muestra de tamaño uno con 
distribución normal con media (i . yvarianza a 2 . 

K ~ N 4t. a 2 ) con p^p+T.+ p. 

esto implica que las observaciones pertenecientes a la ij-ésima población tienen 
esperanza p ;j y varianza a 2 = o 2 en otras palabras existe homocedasticidad. 


Prueba de hipótesis 

La hipótesis de tratamiento sería: 

Ho.-p, = P 2 . - = H, = H 

Ha: p, ^p. i * j 

La media general se puede definir 

p„+p, 2 + ... + p„ 

p =- 

tr 

Vease en la tabla 5.1 las medias poblacionales de los datos. 
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Tabla 5.1. Medias Poblacionales de los datos. 



B. 

b 2 • 

.. B 

r 

P, 

T , 


P, 2 • 

■ 

P,. 



22 

- 1*2, 

M* 2. 

T . 

I a ,, 


- P,r 




P.2 

... P r 



Se puede expresar que: 


p,+p 2 + ... + p u 

p -- 

t 


P = 


z 


p. /1 


(5.2) 


o de la siguiente manera: 

/*.,+ P.2 + - + l i ‘r 

P = -- 


p = S [l - ir 


(5.3) 
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Las desviaciones de (i t con respecto a la media general permite estimar los 
efectos de tratamiento adicionado con el efecto de bloque. 

Mg - M- = T,+ Pj 

Las desviaciones deY„ con respecto a la mediá'de su grupo permite obtener 
la variabilidad aleatoria. 

£ u =Y ¡ i - ^ 

Sy- N(0, a 2 ) 

En síntesis, si: 

y «-^ =8 ü F :i - L = t, + p. 

se puede llegar al componente de varianzas: 

Y = |4 + x + R. + s„ 

'J r i *j y 

presentando dicho modelo dos restricciones: 

t r 

X t. =0 X p. =0 (5.4) 

i=I j =1 

Esperanza y Varianza de Y 

E(Y ¡j ) = E(p + T ¡ +P j +8 i .) 

= p + E(X ¡ )+E(p j )+E(s ij ) 

= p + X.+ p ; 

= Mg (5.5) 
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V(Yy) = V(jx + T.+ P- + 8. j} 

V(Y¡¡) = E(p + x,+ Pj + e^) 2 - [E(ju + x.+ p J + s ( )P 
=E ( Sg y 
= V( £ij ) 

( 

Si se considera que los efectos de bloques y tratamientos son aditivos; 


y calculando la sumatoria: 


S |l,-rn.,x 1+ Z P, 


se divide por r 


r 

z 


IV r - H = -c, 


Si X.= 0 implica ji. = p 

Esto conduce a la hipótesis nula y alternativa antes citada: 

Ho: I. = 0 vs. Ha: X. ^ 0 

El procedimiento es similar para el efecto del bloque. 
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Efecto de Tratamiento y Bloques aleatorios 

Cuando se tienen efecto de tratamiento y bloques aleatorios, la población 
sería de tr subpoblaciones independientes de donde se van a extraer las muestras 
(Hernández A. y E. Soto, 1986). 

La población tendría “T” tratamientos y “R” bloques y se seleccionan 
aleatoriamente t y r medias de tratamientos y bloques con t < T y r < R. 

La sub-población se supone distribuida normal con media p.. y varianza a 2 
. Cuando se seleccionan las muestras, se van a tener sub-poblaciones n muéstrales 
distribuidas normalmente. 

Hipótesis Estadística: 

La hipótesis de tratamiento seria: 

Hoífi, =fi 2 - =H t =H 

Ha: H-¡. ^H-j. i * j 


La media sería expresada como: 


P = X S H„/tr 

/=: y=i ' 

Las desviaciones de Y., con respecto a la media poblacional general es un 
efecto aditivo de tratamiento y bloque, por lo tanto darían los efectos aleatorios: 

e .. = Y.. - u.. 

y y * y 

Y . = U .. + 8 .. 
y " y y 
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Por consiguiente: 

Y = Ll +x. + (3. + 8,. 

U r I r J lj 

Este ultimo sena el modelo de componentes de varianza que es el mismo 
que se obtuvo cuando los efectos eran fijos, deferenciandose en la forma como 
fue muestreada la población. 

Los supuestos que tendría el modelo serian: 

fríj ~ NID (p , cr^ +.a 2 p ) i. ~ NID (0, ü 2 ) 

Pj ~ NID(0, a 2 s ) £.. ~NID(0 ,cj 2 ^) 

Y.. ~ NID(p , cr 2 + a 2 + ° 2 ) 


Como se puede observar el efecto de T- tiene varianza a 2 y B tiene varianza a 2 

1 T J p 

a 2 T = V(T.) = E(X. 2 ) -[EfT,)] 2 = E(X. 2 ) = E(p.- p) 2 

por lo tanto C z representa la variación de p. alrededor de p y a medida que sea CT 2 ^ 
sea mayor se debe interpretar que las desviaciones de las medias de los grupos de 
tratamiento son muy diferentes con respecto a la media general, por lo tanto; 

Si C 2 . => 0 p. => p 

y cuando a 2 ^ = 0 no hay variación entre las p . , esto es, p = p 

Hipótesis Estadísticas: 

Ho: Ct 2 , = 0 
Ha: a 2 x * 0 
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Análisis de Varianza: 

El análisis de varianza del bloque al azar está basado, por supuesto, en el 
modelo lineal de acuerdo a la siguiente consideración: 

- Los efectos de los tratamientos y de las repeticiones o bloques son 
aditivos de acuerdo al modelo lineal establecido. 

- Las subpoblaciones son normales. 

- Las subpoblaciones tienen la misma varianza, es decir, existe 
homocedasticidad. 

- Las muestras son extraídas al azar. 

Es conveniente resaltar que las consideraciones hechas son condiciones 
bajo las cuales la prueba de hipótesis es válida. 

Si se indica por i (i = 1,2, ... , t) al tratamiento, por j (j = 1,2, ..., r) la 
repetición , de manera que la unidad experimental en el tratamiento i y en la 
repetición), puede ser identificada por ij. Habrá tr unidades experimentales 
en total, cuyo modelo definido anteriormente es: 

Y.. = u + t. + (3. + S.. 

ij “ i ij ij 

Notación: 


t 



total de la repetición j. 


B. =Y.j /1 = media de la repetición j. 


Y. = 


r 

z 


Y.. = total del tratamiento i. 

u 


B =Y / r = media del tratamiento i. 
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H Y u 
j=2 Y p 

H y .3 


El gran total y la media general son: 

Y.. = É Y . = = Z Y . 

/=! '• y=i 

Y..= É Y./t = Z Y / r=¿ Z Y ../ 1 

/-i *• >1 •' 1-1 y-i " 


El efecto de las replicaciones y de los tratamientos es 

y. = B. - B.. 


Con las restricciones: 


ír-0 Z 


7 ¡ = 0 
/=i J 
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De acuerdo a lo anterior Y., puede ser expresado: 

Y.. = EL + (El. -EL)+ (Y.- EL) +(Y.. - B¡. - el +s:.) 

Y.. = H.. + x. + y. + s 
«j «• 1 j i} 


donde 


e.j =Y.. -(EL + x. + y. ) 


Estimaciones por mínimos cuadrados 


La suma de cuadrados a ser minimizados para lograr los valores 
apropiados de Y, y, x. es: 

Q= (Y. -EL - x. -y.) 2 

^ i j ' *j '■ *-r 


.ii 


e.. • 

i j •) 


Derivando Q con respecto a Y.., x¡ , y e igualando a cero, se obtienen un 
conjunto de ecuaciones que pueden ser resueltas, con las restricciones mencionadas 
en la ecuación 5.7, quedando entonces, expresiones de la forma: 


Y n 

= SL 

- x , - 

Y, 


= B.. 

- L - 

y 2 

Y, 3 

= H.. 

- T , - 

y 3 

y 2 , 

= EL 

- x 2 - 

Y, 

y 22 

= B„ 

- L - 

y 2 

y 23 

= B.. 

- X 2- 

y 3 

y 31 

= B.. 

- - 

Y, 

y 32 

= B.. 

- ^3 ' 

y 2 

Y 33 

= 5L 

- - 

y 3 

y 4 , 

= B.. 

- - 

Y, 

y 42 

= E.. 

- T 4 - 

y 2 

Y 43 

= B.. 

- ^4 - 

y 3 


Para estimar p se hace la suma de las doce expresiones, nótese que al 
estimar el valor de p se desconoce la media general. 
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Y.. - Z I Y../1r 

,=i /-i « 

Para estimar ^ , se ignoran las expresiones que no tienen y y se hace la 
suma de las expresiones que involucra a y y se iguala a cero. 


I Y., -tH.. - ty, =0 

i=i 

y t = 83 , - Si¬ 


en forma semejante, al efecto x 

r 

I Y,. -rY.. - r x, - 0 
i) i 


x = Y - Y.. 

i i. 


y así sucesivamente con el resto. En las estimaciones por mínimos cuadrado, el 

II 


valor 


£ es un mínimo. 


Componentes de la Suma de Cuadrados 

La desviación total es la desviación de cada valor de la media general y 
puede ser escrita de la siguiente manera: 

Y.. -Y.. = (Y. -?..) + (Y.-Y..) + (Y. - Y. -Y+Y..) 


si se eleva al cuadrado cada uno de los términos y se suman, se obtiene la identidad 
siguiente: 
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^ - E.) 2 =t X (B ¡ -m.) 2 + r¿ (E.- E ) 2 +XX (Y.. - 0. - 
' J 7=1 i=l i i 


fij + B y 


= t ¿ y 2 +r X X ¡ 2 + X 2 

7=1 J 1=1 1 1=1 7=1 


8 2 


(5.8) 


Análisis de Varianza 

El esquema de ANAVAR para este diseño aumentado con sus respectivas 
Esperanzas de los cuadrados medios sera mostrado en la tabla 5.2. 
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Esperanza de la Suma de Cuadrados: 

Si se establece que no hay interacción entre replicaciones y tratamiento, £.. 
es independiente y normalmente distribuido con media igual a cero y varianza 
° 2 • Se supone también que Ti y y. no están correlacionados, por consiguiente 
se puede expresar: 

E(Yd ) =E[tp + ^X; + <r J+ Z e.J 2 

E(Y.. 2 ) = tja 2 +1 2 a 2 +t ct 2 + ta 2 (5.9) 

P t e 


donde CTp 2 = E(y, 2 ) y la esperanza de los términos producto es cero. 

EJEMPLO ILUSTRATIVO 

En la siguiente tabla se presentan los resultados (rendimiento en Kg/parcela 
de 28 m 2 ) de un ensayo con seis poblaciones de tomate. 


Tabla 5.3. Datos en el ejemplo ilustrativo para el diseño en bloques aleatorios. 


Población 


plantas/ha 

Trat 

i 

II 

III 

IV 

Total 

Y 

17857 

1 

49,51 

35,27 

75,20 

86,65 

246,63 

61,66 

23928 

2 

38,46 

55,00 

53,51 

70,35 

217,32 

54,33 

28571 

3 

45,05 

65,47 

87,27 

64,96 

262,75 

65,69 

35714 

4 

47,62 

66,11 

75,64 

74,18 

263,55 

65,89 

47851 

5 

80,74 

62,06 

53,79 

72,66 

269,25 

67,31 

71428 

6 

74,97 

69,86 

82,69 

55,25 

282,77 

70,69 

Total 


336,35 

353,77 

428,10 

i • V v ’ 

424,05 

1542,27 

1 ;í \ 
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1. Modelo Lineal Aditivo: 


7 = li +x + B.+ 8 .. 

y “ * n u 

i = 1>2, — , t j = 1,2,... ,r 

Y.. = observación del i-ésimo tratamiento en el j-ésimo bloque. 

¡u = media general, 

x. = efecto del i-ésimo tratamiento. 

P j = efecto del j-ésimo bloque. 

S ( = efecto aleatorio en el i-ésimo tratamiento y en el j-ésimo bloque que mide 

el error experimental. 


2. Supuestos del Modelo: 


Modelo I 

X r = 0 

,=i 

P | ~ NID(0,ay 
£.. ~ NID(0,CT 2 ) 


Modelo II 
x, ~ NID (0, o 2 ) 

X 

p. ~ NID (0, a 2 ) 
£.. ~ NID (0, a 2 ) 
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3. Hipótesis: 


Modelo I 

Modelo II 

Para Tratamientos 

Ho: T. = 0 

1 

Ho: 

CT 2 =0 

T 

Ha: X. 0 

Ha: 

a 2 ^ 0 

Y' 

ParaBhques 

Ho: (f -0 

3 

Ho: 

(J 2 =0 

p 

Ha: (7 2 0 

3 

Ha: 

a 2 ^0 
3 


4. Esquema del Análisis de Varianza: 

Ver Tabla 5.2. 

5. Desarrollo del Ejemplo: 

Suma de Cuadrados 

Suma de Cuadrados de Tratamiento: 

246,63 2 + ... + 282,77 1542,27 2 

SCTRAT --- 

4 24 

Suma de Cuadrados de Bloques: 

336,35 2 + ... + 424,05 2 1542,27 2 

SCBLOQ --- -- 

6 24 


643,03 


- 1120,56 
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Suma de Cuadrados To/al: 

SCTOTAL = 49,51 2 + 38,46 2 + ... + 72,66 2 + 55,25 2 -1542,27 2 /24 = 5015,20 
Suma de Cuadrados del Error Experimental: 

SCEE = SCTOTAL - SCTRAT - SCBLOQ = 3251,61 

Cuadrados Medios o Varianzas 

Cuadrado Medio de 1 'ratamienio: 

CMTRAT = SCTRAT/(t-1) = 643,03/5 = 128,61 

Cuadrado Medio de Bloque- 

CMBLOQ = SCBLOQ/(r-1) = 1120,56/3 = 373,52 

Cuadrado Medio del Erwr Experimental 

CMEE = SCEE / (t - l)(r - 1) = 3251,61/15 = 216,17 


Análisis de Varianza (ANAVAR) 


Fuente de 
Variación 

Grados de 
libertad 

Suma de 
Cuadrados 

Cuadrados 

medios 

Fe 

Tratamiento 

5 

643,03 

128,61 

0,59 

Bloque 

3 

1120,56 

373,52 

1,73 

Error 

15 

3251,61 

216,17 


Total 

23 

5015,20 
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Prueba de Hipótesis 

Para tratamiento: 

Fe = CMTRAT / CMEE = 0,59 N - S - 
Ftab 5% = 2,90 Ftab 1% = 4,56 


Para Bloque: 

Fe = CMBLOQ / CMEE = 1,73 N - S - 
Ftab 5% = 3,29 Ftab 1% = 5,42 


Interpretación: 

De acuerdo a los resultados se puede establecer que F no es significativa, 
por lo tanto, no se rechaza la hipótesis nula, es decir, Ho: X. = 0. Esto se puede 
interpretar como que no hay diferencias entre los tratamientos (poblaciones de 
plantas estudiadas), los rendimientos promedios correspondientes a las poblaciones 
de plantas cosechadas fueron estadísticamente iguales. 

Para bloques, no se rechaza la hipótesis nula Ho:a 2 =0, por consiguiente 
no hay diferencias entre los bloques, interpretándose cíomo que existe cierta 
homogeneidad entre los bloques. 
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EJERCICIOS 

Con un conjunto de datos afín a su investigación, responda las siguientes preguntas: 

- Establezca el modelo lineal aditivo describiendo cada uno de los 
términos del modelo y los subíndices presentes. 

- Dé los supuestos del modelo. 

- Establezca las hipótesis a probar. 

- Escriba el cuadro de ANAVAR de acuerdo al modelo. Considere 
cuadrados medios esperados y los estadísticos de prueba. 

- Realice el ANAVAR 

- Pruebe las hipótesis. 

- Interprete los resultados. 
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DISEÑO EN BLOQUES AL AZAR CON SUBMUESTREO 
I.- Modelo Lineal aditivo 

Y ¡¡k = +T i + Pj + e ü + S. jt (5.10) 

i = L2,, t j = 1,2,..., r k = 1, 2 ..., m 

P j = efecto de bloque 
£ = efecto del error experimental 
8. jk = efecto del error de muestreo 


//.- Supuestos 

Modelo I 

X r. = 0 

1=1 

p. ~ NID (0, a 2 (J ) 
8 ¡j ~ NID (0, g 2 s ) 
5. jk ~ NID (0, ^ 5 ) 


Modelo II 


X ¡ ~ NID (0, ct 2 t ) 
p, -NlD^.ay 

e* ~ NID (0, ct 2 c ) 
8, jk ~NID(0, CT 2 6 ) 
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III.- Hipótesis: 


Modelo I 

ModeloII 

Tratamiento: 

Ho: T¡ = 0 

Ho: a 2 =0 

X 

Ha: x. ± 0 

Ha: G- * 0 

Bloque: 

X 

Ho: a 2 =0 

Ho: CT 2 =0 

P 

P 

Ha: O 2 ^ 0 

Ha: a 2 * 0 

P 

Error: 

P 

Ho: a 2 =0 

Ho: CT 2 =0 

8 

8 

Ha: a 2 * 0 

Ha: cr 2 * 0 


e e 


IV.- Prueba de Hipótesis 

F C TRAT > F tab (a, t-1, (t— l)(r— 1)) Se rechaza Ho 
F c TRAT<F tab O, t-1, (t- l)(r— 1)) No se rechaza H o 

F c BLOQ> F tab («, r-1, (t— l)(r— 1)) Se rechaza Ho 
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F c BLOQ < F tab (tír, r-1, (t-l)(r-l)) No se rechaza Fio 

F C EE > F tab (flr, (t- l)(r- 1) ; tr(m- 1)) Se rechaza Ho 
F C EE < F tab (a, (t- l)(r-1); tr(m- 1)) No se rechaza H o 

Generalmente, se prueba primero el F del error, de manera de que si no hay 
significación se usa un pool de errores; esto es: 


CMEE(conjunto) 


SCEE+SCEM 
(t- l)(r- 1) + tr(m- 1) 


(5.11) 


Si el FEM da significativo es porque hay diferencia entre las unidades 
experimentales en el mismo tratamiento. 


Ejemplo Ilustrativo 

Se analizaron los mismos datos que se utilizaron en el ejercicio del Diseño 
Completamente Aleatorizado con Submuestreo, (el cual solo se hizo con fines 
didácticos) , pero ahora es a través del Diseño en Bloques al Azar que fue el 
diseño que realmente se usó en el montaje del experimento. 

El modelo se considera fijo por las razones expuestas anteriormente. 

I.- Modelo Lineal aditivo 

Y.. = Ll +X.+ B.+ £.. + 8 

ijk r~ i lj ij ijk 

i=l>2, ,t j = 1,2,... ,r k = 1, 2 ..., m 


II.- Supuestos 


s 


r. = o 


X p. = 0 s ~ NID(0,a 2 ) 

j-^ 6 

§ ¡Jk ~NID(0, O 2 ) 
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LH.- Hipótesis 


Ho: X. = 0 

I 

Ha: x. Jt 0 

l 


Ho: 6. =0 Ho: a 2 =0 

Ha: p. * 0 Ha: O 2 íO 


IV.- Análisis de los Resultados 
Ver Tabla 5.4 


Tabla 5.4. Análisis de Varianza para un diseño en bloques al azar con subinuestreo 


F. de V 

G. de 1. 

Suma de cuadrados 

Cuadrados Medios ECM 

F 

Trata- 

t -1 

^ Y ¡ 2 / rm - E.C. 

<=i 

SCTRAT/(t- 1) 

<r & + m (r r + 

CMTRAT/ 

miento 

= 10 

= 37019293 

= 3701929,30 

mr¿ t, 2 /(t-1) 

CMEE 






= 3,28 

Bloques 

r - 1 

¿ Y j 2 / tm - F.C. 

r-t 

SCBLOQ / (r - 1) 

o 7 ¿ + m cr, + 

Im ¿ Pt 2 /Cr-I) 

CMBLOQ / 
CMEF. 


= 3 

= 6800606 

= 2266868.7 


= 2,01 

Error 

(M)(r- 1) 

i í Y * 2/ m - 

i=l j* 1 

SCEE/(t-1 )(r - 1) 

cr 6 + ni cr f 

CMEE / 

Experi- 


F.C. - SCTRAT - 



CMEM 

mental 

= 30 

SCBLOQ 

= 1126288.13 


= 0.54 



= 33788644 





rt - (m - 1) 





Error de 


SCToial - SCTRAT- 

SCEM/rt (m - 1) 

o 2 » 


Mueslreo 

= 44 

SCBLOQ- SCEE 

= 2077234.73 





= 91398328 




Total 

rtm - 1 

¿SÉ V 

i-t ja\ í=.| 






- F.C. 





= 87 

=169006871 





lie 



Suma de Cuadrados 

i ^ r ^ m 

F.c. = E E E Y 2 / trm = (694833,73) 2 / 88 = 5486294457 

i=l J =l k =I 


•&07W de Cuadrados de Tratamiento: 

t 

SCTRAT = E Y. Vrm - F.C 


SCTRAT = (50248,56) 2 + (66517,40) 2 +...+(58031,09) 2 

-7---— - 5486294457 


SCTRAT = 5523313750-5486294457 = 37019293 


Suma de Cuadrados de Bloque: 


SCBLOQ - E Y. 2 /tm - F.C 

j =i 

SCBLOQ = 6800606 


Suma de Cuadrados del Error Experimental: 

t r 

SCEE = z z Y.. 2 / m - F.C-SCTRAT-SCBLOQ 


SCEE =33788644 
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Suma de Cuadrados del Total: 

t r m 

SCTOTAL =1 Z E Y ., 2 - F.C. 

/=i j =i * =] ,,k 

SCTOTAL = 5655301328 - 5486294457 = 169116871 
Suma de Cuadrados del Error de Muestreo: 

SCEM = SCTOTAL - SCTRAT - SCBLOQ - SCEE 
SCEM = 91398328 

Prueba de Hipótesis 

Para Tratamiento: 

Fcal = 3,28 Ftab = 2,18 (lOgl, 30gl, 0,05) 

Ftab = 2,98 (lOgl, 30 gl, 0,01) 

Para Bloque: 

Fcal = 2,01 Ftab - 2,92 (3gl, 30gl, 0,05) 

Ftab = 4,51 (3gl, 30gl, 0,01) 

Para el Error Experimental: 

Fcal = 0,54 Ftab = 1,72 (30gl, 44 gl, 0,05) 

Ftab = 2,15 (30 gl, 44 gl, 0,01) 
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Coeficiente de 'Variación 


nran VCMEM V2077234,73 

CV(M)= —= -xlOO =——x 100 = 18% 


X 


;cneral 


7895,84 


VCMEE _ 71126288,13' 

CV(UE) = —=- xlOO = ~ 7 _.1 -xlOO = 7% 


X 


UE 


15791,68 


Interpretación de Residtados 

En este caso los resultados fueron muy semejantes a los obtenidos 
anteriormente con el Diseño Completamente Aleatonzado con submuestreo, 
con la diferencia de que aquí se debe interpretar el efecto de bloques, el cual no 
fue significativo; por lo que se puede asumir que P j = 0 , o sea que no existió un 
efecto muy marcado de bloque. Es posible que no haya sido necesario bloquear, 
sino mas bien realizar el ensayo en forma de Diseño Completamente Aleatorizado, 
que es más sencillo de manejar y planificar en el campo. 
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DISEÑO DE EXPERIMENTO CUADRADO LATINO 


Introducción 

El Diseño Cuadrado Latino permite medir la variabilidad en doble sentido 
o controlar el efecto de dos factores que no se desea que formen parte del error 
experimental, ya que abultaría dicho error y no se haría eficiente la comparación 
de los tratamientos. 

Con la utilización del diseño se cumplen los tres principios básicos: 

a) Aleatorización-, ya que los tratamientos son asignados aleatoriamente a las 
unidades experimentales, pero bajo una doble restricción debido a que cada 
tratamiento debe estar representado en cada hilera o fila y en cada columna del 
diseño. 

b) Replicaciones; porque cada tratamiento está repetido tantas veces como 
columnas o filas tenga el diseño. 

c) Control Local ; ya que el agrupamiento de las unidades experimentales y la 
asignación al azar de los tratamientos a ellas, se hacen de forma tal de controlar la 
variabilidad tanto en el sentido de las filas como en el sentido de las columnas. 


Ventajas y Desventajas del Diseño Experimental Cuadrado Latino 

Su principal ventaja radica en que cuando las condiciones son muy 
heterogéneas él puede controlar variabilidad en dos sentidos y de esta manera 
extraer esta alta variabilidad e incorporarla a las fuentes de variación filas y 
columnas de tal manera de hacer una comparación eficiente de los tratamientos. 
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Su principal desventaja es que tiene menos grados de libertad para el error 
experimental que los otros diseños y por consiguiente, si en realidad no existen 
condiciones experimentales de variabilidad o heterogeneidad en un solo sentido 
el diseño es menos eficiente que el completamente al azar en el primer caso y que 
el bloque al azar en el segundo caso. 


Modelo Lineal Aditivo 

El supuesto fundamental de un diseño cuadrado latino con una observación 
por unidad experimental es que las observaciones pueden ser representadas por 
un modelo lineal aditivo, como el siguiente: 


^,= P + 'L+Y j + P k +e iJ(k) (6-1) 

para i=l, 2,... h j = l,2,...h k = 1,2,... h. 
con las restricciones; 

h h i, 

Y, t. y = Z P k =0 (6.2) 

i=l 7=1 k= 1 

Los e..^ están distribuidos independientemente y normalmente con media 
0 y varianza común a 2 . Puede observarse que se colocaron paréntesis en el 
subíndice, indicando esto que de ninguna manera puede considerarse que k es 
independiente de i y j. Los parámetros r. ,y. ,p k son efectos verdaderos 
asociados con el i-ésimo tratamiento, j-ésima fila y k-ésima columna 
respectivamente. 


122 




_ Diseño y Análisis de Experimentos 6 

Supuestos e Hipótesis en el diseño Cuadrado Latino 
bajo efecto de tratamiento fijo 

Los supuestos del modelo lineal aditivo serían los siguientes: 

h 

¿ r = 0 

í=i 1 

y¡ ~ nid(o,ct : y ) 

P, ~ NID (0 , CT 2 p ) 
e iKk, ~NID(0,a 2 e ) 

En este caso se está considerando que los efectos de fila y columna son 
aleatorios, supuestos que son indispensables para que el investigador pueda 
extrapolar los resultados obtenidos en determinado campo a otros sitios con 
condiciones similares a las usadas en la experimentación. 

Las hipótesis planteadas son: 

Para tratamiento 

Ho: x =0 
1 

Ha: X y 0 

I 

Para fila 
Ho: CT 2 y = 0 

Ha: a 2 r ^ 0 

Para columna 
Ho: (J 2 p = 0 

Ha: CT 2 p y 0 
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Supuestos e hipótesis en el diseño Cuadrado Latino 
bajo el efecto de tratamiento aleatorio. 

Los supuestos del modelo lineal aditivo serían: 

T. ~ NID(0,CT 2 t ) 
y i ~ nid (0, cr 2 y ) 
p. ~ NID (0, a 2 p ) 

8, j(k) ~ NID (0 , CT\) 

En este caso se está considerando a los tratamientos aleatorios, es decir, se 
parte del supuesto de que en la población existen “T” tratamientos y se extraen al 
azar “t” muestras, de tal forma que t < T. 

Hipótesis: 

Para tratamiento 
Ho: cr 2 t = 0 


Ha: a\ * 0 

Para fila 
Ho: = 0 

Ha: * 0 

Para columna 
Ho: cr 2 p = 0 

Ha: C 2 p * 0 

El Esquema de ANAVAR para este diseño experimental en los casos de 
Modelos Fijos y Modelos Aleatorios aumentados con sus respectivas esperanzas 
de los Cuadrados Medios será mostrado en la Tabla 6.1. 
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Tabla 6.1. Esquema de ANAVAR aumentado con las Esperanzas de los Cuadrados Medios para 
el Diseño Cuadrado Latino. 
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EJEMPLO ILUSTRATIVO 

En la siguiente tabla (Tabla 6.2) se presentan los resultados (rendimiento en 
Kg./parcela en parcelas de 6,40 m 2 ) de un ensayo con 5 variedades de papa 
sembrado en Timotes, Estado Mérida. 


Tabla 6.2. Datos en el ejemplo Ilustrativo para el Diseño Cuadrado Latino. 



1 

2 

3 

4 

5 

Total 
de fila 

1 

A 

B 

C 

D 

E 



1,7 

3,0 

2.5 

3,0 

0,6 

10,8 


E 

C 

D 

B 

A 


2 

2.0 

3,6 

3,2 

4,0 

3,0 

15,8 


C 

D 

A 

E 

B 


3 

3,0 

3,0 

3,0 

2,0 

2,4 

13,4 


B 

A 

E 

C 

D 


4 

3,0 

2,7 

1,1 

2,2 

3,1 

12,1 


D 

E 

B 

A 

C 


5 

3,2 

1,7 

5,4 

2,6 

3,3 

16,2 

Total de 







Columna 

12,9 

14,0 

15,2 

13,8 

12.4 

68.3 

Totales para 

cada variedad: 

<3 

rn' 

T— ■( 

II 

c 

B = 7,8 

sO 

rH 

II 

(J 

D = 15,5 E = 7,4 


Promedio para cada variedad: A=2,60 B = l,56 C=2,92 D = 3,10 E= 1,48 
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Y m = ^ + x ¡ + y ¡ + P k +E ¡j(k) (6- 1 ) 

para i = 1,2,... íl j = 1, 2,... h k = 1,2,... h. 

Y. j(k) representa la observación del i-ésimo tratamiento en la j-ésima fila y k- 
ésima columna. 

p es el efecto común de todo el experimento o media poblacional. 

T. son los efectos o desviaciones debidas al i-ésimo tratamiento, 
y. es el efecto o desviaciones debido a la j-ésima fila, 
p t es el efecto o desviaciones debido a la k-ésima columna. 

£ ¡j(k) es el efecto aleatorio en el i-ésimo tratamiento de la j-ésima fila y k-ésima 
columna que mide el error experimental. 

Supuestos del Modelo: 


m 

h 

X T,=0 

i=l 

Yj ~ NID (0, a 2 y ) 
p k ~ NID (0, a 2 p ) 

s ij(k> ~NID(0,a 2 J 
Hipótesis 
M(I) 

Para tratamiento 
Ho: T . =0 

Ha: T. ^ 0 

l 


M(II) 

t, ~ NID (0, a 2 T ) 
y j ~ NID (0, ct 2 7 ) 
p k ~ NID (0, cr 2 p ) 
£, j(k) -NiDÍO.a 2 ,) 

M(IJ) 

Ho: oq = 0 
Ho: ct 2 t = 0 
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Para fila 

O 

II 

e> 

Ho: = 0 

Ha: G 2 y * 0 

Ha: G\ * 0 

Para columna 

Ho: CJ 2 p = 9 

Ho: a 2 p = 0 

Ha: O 2 p jt 0 

Ha: a 2 p 0 


Esquema del Análisis de Varianza. 

Ver Tabla 6.1 

Desarrollo del ejemplo. 

Suma de Cuadrados 

Sumade Cuadrados de Tratamiento: 

13,0 2 + ... + 7,42 2 

SCTRAT =- 

5 

Suma de cuadrados de Filas: 

10,8 2 + ... + 16,20 2 68,30 2 

SCFILA ---- 

5 25 


68,30 2 


25 


12,2064 


= 4,3424 
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Suma de adadrados de Columnas: 

12,90 2 + ... + 12,40 2 68,30 2 

SCCOL =---= 0,9344 

5 25 

Suma de Cuadrados Total: 

SCTOTAL = 1.7 2 + ... + 3,3 2 -68,30 2 / 25 = 21,7544 
Suma de Cuadrados del Error Experimental: 

SCEE = SCTOTAL - SCTRAT- SCFILA - SCCOL = 4,2712 

Cuadrados Medios o Varianzas 
Cuadrado Medio de Tratamiento-. 

CMTRAT = SCTRAT/ (h-1) = 12,2064/4 = 3,0516 

Cuadrado Medio de Fila: 

CMFILA = SCFILA / (h -1) = 4,3424 / 4 = 1,0856 

Cuadrado Medio de Columna: 

CMCOL = SCCOL / (h - 1) = 0,9344 - 4 - 0,2336 
Cuadrado Medio del Error Experimental: 

CMEE = SCEE / (h - l)(h - 2) = 4,2712 / 12 = 0,3559 
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Fuentede 

Variación 

Grados de 
libertad 

Suma de 
Cuadrados 

Cuadrados 

media 

Fe 

Tratamiento 

4 

12,2064 

3,0516 

8,57*' 

Filas 

4 

4,3424 

1,0856 

3,05 

Columnas 

4 

0,9344 

0,2336 

<1 

Error 

12 

4,2712 

0,3559 


Total 

24 

21,7544 




Prueba de Hipótesis 
Paratratamiento-. 

Fe = CMTRAT / CMEE - 8,57** 

Ftab 5% = 3,26 Ftab 1% = 5,41 

Para Fila: 

Fe = CMFILA / CMEE = 3,05 NS - 

Ftab 5% = 3,26 Ftab 1% = 5,41 

ParaColumna- 

Fe = CMCOL / CMEE - < 1 NS 
Ftab 5% = 3,26 Ftab 1% = 5,41 
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Interpretación: 

Tratamientos 

Comparando el F tabulado con el F calculado, se observa que el F calculado 
es mayor que el F tabulado a un nivel de significación a = 0,01 por lo que se 
interpreta que los tratamientos difieren estadísticamente; es decir, se rechaza la 
hipótesis nula de que los tratamientos son iguales y se acepta la alternativa de que 
por lo menos uno de los tratamientos es diferente a los demás. 

Filas 


No se rechaza la hipótesis nula Fio: &. t = 0; por lo que se concluye que no 
existe variación estadística entre las medias de rendimiento de las filas. 

Columnas 

No se rechaza la hipótesis nula Ho: & p = 0; es decir, no existen diferencias 
estadísticas significativas entre las medias de rendimiento de las columnas. 

EJERCICIOS 

Con un conjunto de datos afín a su investigación, responda las siguientes 
preguntas: 

- Establezca el modelo lineal aditivo describiendo cada uno de los 
términos del modelo y los subíndices presentes. 

- Dé los supuestos del modelo. 

- Establezca las hipótesis a probar. 

- Escriba el cuadro de ANAVAR de acuerdo al modelo. Considere 
cuadrados medios esperados y los estadísticos de prueba. 

-Realice el ANAVAR. 

- Pruebe las hipótesis. 

- Interprete los resultados. 
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DISEÑO CUADRADO LATINO CON SUBMUESTREO 


Modelo Lineal aditivo 

Y.... ,= u +T. + a.+ B + s.... + 8,. v 

(Ojml r i j (i)j m (i)jm 


II.- Supuestos 
Modelo I 

Y X. = 0 
r=l 

0L¡ ~ NID (0, a 2 a ) 
P m ~ NID (0, CT 2 p) 
e (¡)jm ~ NID (0, <J 2 e ) 
SfflM ~ NID (0, a 2 5 ) 


Modelo II 

T. ~ NID (0, 0 2 t ) 

a -NID(0,a 2 a ) 
P m ~NID(0,a 2 p ) 
s (¡)jm ~NID(0, a\) 

S ( ,M -nidio, ay 


(6.3) 
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III- Hipótesis: 


Modelo I 

Modelo II 

Tratamiento: 


Ho: x. = 0 

I 

O 

II 

t-* 

b 

o 

X 

Ha: x. 0 

Ha: a 2 t 0 

Filas: 


Ho: 0 2 a =0 

Ho: CT 2 a =0 

Ha: 0 

Ha: <J 2 a ^ 0 

Columnas: 


Ho: Q 2 p =0 

Ho: a 2 3 =0 

Ha: o 2 p js 0 

Ha: c 2 p ^ 0 

Error 


Ho: <7 2 E =0 

Ho: CT 2 6 =0 

Ha: <j 2 e * 0 

Ha: a 2 s * 0 
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IV.- Prueba de Hipótesis 

F C TRAT > F tab (a, k-1, (k-l)(*-2)) Se rechaza Ho 
F C TRAT < F lab (a, k-1, ( k- l){k -2)) No se rechaza Ho 

F C FILA > F lab (a, k-1, (k-l)(k-2)) Se rechaza Ho 
F C FILA < F lab (a, k-1, ( k - l)(/c — 2)) No se rechaza Ho 

F c COL > F tah (a, k-1, (k-1)(& - 2)) Se rechaza Ho 
F c COL < F lab (a, k-1, (k-l)(k-2)) No se rechaza Ho 

F C EE > F tab (a, (k - l)(/c - 2) ; k 2 {m- 1)) Se rechaza Ho 
F C EE < F lab (a, (k - l)(k - 2); k 2 (m - 1)) No se rechaza Ho 

V.- Análisis de Varianza 

Se muestra en la tabla 6.3 presentada a continuación. 
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Tabla 6.3. Esquema de ANA VAR para el Diseño Cuadrado Latino con submuestreo 
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EJERCICIOS 

Con un conjunto de datos afín a su investigación, responda las siguientes 
preguntas: 

- Establezca el modelo lineal aditivo describiendo cada uno de los 
términos del modelo y los subíndices presentes. 

- Dé los supuestos del modelo. 

- Establezca las hipótesis a probar. 

- Escriba el cuadro de ANAVAR de acuerdo al modelo. Considere 
cuadrados medios esperados y los estadísticos de prueba. 

-Realice el ANAVAR. 

- Pruebe las hipótesis. 

- Interprete los resultados. 
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COMPARACIONES DE MEDIAS. 
PRUEBAS DE RANGO MÚLTIPLE 
TEORÍA BÁSICA Y APLICACIONES 


Introducción 


Cuando se realiza el análisis de varianza y se rechaza la hipótesis nula para un 
determinado efecto fijo, se llega a la conclusión de que por lo menos una de las 
medias de los grupos involucrados en esa fuente de variación difiere del resto y 
no se puede especificar cual de ellas es la que presenta la diferencia. Por ello es de 
gran utilidad efectuar comparaciones adicionales entre las medias de los grupos o 
tratamientos. Dichas comparaciones se realizan en términos de los totales de 
tratamiento Y. o de los promedios de tratamiento Y.. Los procedimientos para 
efectuar las comparaciones se denominan métodos de comparación múltiple. 

Estos métodos se ocupan de los procedimientos y tasas de error que no se 
estudian al aplicar la prueba de “t” y la prueba de “F”. Con la primera, se comete 
un error tipo I al rechazar erróneamente una hipótesis con respecto a un solo 
parámetro o diferencia de dos parámetros. En el caso de la prueba de “F”, la 
hipótesis incluye muchos parámetros dentro de un experimento; ello se puede 
considerar como la prueba de hipótesis simultánea con respecto a muchas 
diferencias, en las que el rechazo general depende de una ó mas diferencias no 
especificadas. 

De allí la necesidad y el origen de las pruebas de comparaciones múltiples 
de medias. En este capítulo se estudiarán las siguientes pruebas de rango múltiple: 

- Mínima Diferencia Significativa (mds) 

- Contrastes Ortogonales. 

- Prueba de Dunnett. 

- Prueba de Sheffé. 
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- Prueba de Student, Newman y Keuls (S.N.K) 

- Procedimiento W de Tukey. 

- Prueba de Amplitudes Múltiples de Duncan. 

- Prueba t de razón k-bayesiana de Waller-Duncan. 

- Prueba de Bonferroni. 

Inicialmente se mencionan algunos aspectos importantes en cuanto a los 
supuestos requeridos para la aplicación de estas pruebas. Posteriormente se ofrecen 
algunas clasificaciones de las mismas, en base a criterios prácticos, como una guía 
para su correcta aplicación a casos específicos. 

Luego se mencionan los antecedentes, la metodología aplicada en un ejemplo, 
para finalmente ofrecer una revisión bibliográfica general que ilustre el desarrollo 
de la investigación en este importante tema a través del tiempo. 

Supuestos y Condiciones para la aplicación de las 
Pruebas de Rango Múltiple 

WELCH, B. L. (1951) en su trabajo sobre “una aproximación como 
alternativa en la comparación de varias medias”, resume muy apropiadamente las 
suposiciones básicas de las pruebas de rango múltiple, al discutir el trabajo de 
JAMES(1951), señalando: 


“Sean Y (t = 1,2,..., k) estadísticos normales e independientes distribuidos 
con media ¡y y varianzas Q t G 2 respectivamente, donde las son constantes 
conocidas, siendo p ( y G 2 desconocidas. Se supone que los datos permiten la 
estimación de o 2 a través de s t 2 , donde s 2 están distribuidas respectivamente 
como x, 2 <7 2 / f, siendo f los grados de libertad de x, 2 - Se supone además que 
todas las s 2 están independientemente distribuidas para cada uno de los Y r 

El problema consiste luego en probar si los datos son consistentes con 
respecto a la hipótesis de que todas las p son iguales, es decir, p =p para 
(t = 1;2, ...,k)”. 
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Señala el autor que un caso particular de Y pueden ser las medias x de t 
muestras de n t observaciones de k diferentes poblaciones normales cuyas medias 
y varianzas son p t y a t 2 , respectivamente. 

Dado que V(xJ = a 2 /n , se tiene (de acuerdo a lo anterior) que 
W t = 1/n • Cada muestra proporciona estimaciones s ( 2 dea 2 . La hipótesis bajo 
estudio establece si se puede considerar que las poblaciones muestreadas poseen 
la misma media, bajo la condición de que sus varianzas sean necesariamente 
iguales. 

La suposición de que los datos permiten la estimación de a, 2 a través de s 2 
y la distribución de este estadístico, establece la necesidad de una escala de medida 
en la variable bajo estudio; por otra parte se refleja la importancia de probar los 
supuestos con pruebas adecuadas. Tal es el caso de la prueba de Barlett para 
verificar si todas las muestras estiman la misma varianza. 

Se aprecia claramente que las pruebas de rango múltiple requieren del 
cumplimiento de una serie de supuestos de forma similar al análisis de varianza. 


Clasificación de las Pruebas de Rango Múltiple 

A continuación se ofrecen dos clasificaciones de las pruebas de rango múltiple 
las cuales pueden constituir una orientación inicial desde el punto de vista práctico, 
para su aplicación. En este sentido se describe brevemente cada una de las categorías 
establecidas. 

De acuerdo a su naturaleza 

Pruebaspredetemñnadas 

Son aquellas cuya aplicación está “restringida” a las situaciones en las que las 
comparaciones a realizar son planificadas previamente. En una comparación 
planeada, se les da nombres a los tratamientos de antemano; no es necesario 
esperar los resultados, por ejemplo para saber cual tratamiento está asociado con 
la mayor respuesta (SteelyTorrie, 1990). 
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Las pruebas predeterminadas pueden conducir a resultados sin validez cuando 
son aplicadas en comparaciones sugeridas por los datos. Dentro de esta categoría 
se incluyen las siguientes pruebas: 

Mínima Diferencia Significativa (m.d.s) 

Contrastes Ortogonales 
Prueba de Dunnett 

Pruebas de efectos sugeridos por ¿os datos 

Son aquellas pruebas que se aplican en situaciones en las que se conoce poco 
con respecto a la naturaleza de los tratamientos y se vacila en proponer 
comparaciones con sentido. Estas técnicas son muy utilizadas para comparar 
todos los posibles pares de medias. 

Con respecto a este tipo de pruebas Steel y Torrie, 1990 exponen: 

Cuando la hipótesis va a ser sugerida por los datos o se incluyen mas 
comparaciones que los grados de libertad para los tratamientos, entonces se debe 
tener mucho cuidado en el procedimiento de prueba. 

Se incluyen en este grupo las pruebas: 

Prueba de Scheffé 

Prueba de Student Newman y Keuls (S.N.K.) 

Procedimiento W de Tukey 

Prueba de Amplitudes Múltiples de Duncan 

Prueba t de razón bayesiana de Waller-Duncan 

Prueba de Gabriel 

Prueba de Bonferroni 
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De acuerdo a las comparaciones de interés 

Pruebas contra un testigo. Se destacan en esta categoría aquellas pruebas cuyo 
objetivo es comparar todas las medias de los tratamientos contra un testigo 
preestablecido. Esta consideración involucra obviamente la necesidad de una 
planificación previa predeterminada. Se incluye en el presente grupo la prueba 
deDunnett. 

Pruebas que involucran solo algunas comparaciones. Son aquellas pruebas 
predeterminadas, con las cuales es posible efectuar solo algunas comparaciones, 
dentro de las que pueden incluirse o no, las comparaciones contra un testigo. 
Esta restricción depende de las características de cada prueba. Se incluyen aquí las 
pruebas: 


Mínima diferencia significativa (m.d.s.) 

Contrastes Ortogonales 

En la m.d.s. pueden efectuarse como máximo, un número de comparaciones 
igual a los grados de libertad de tratamiento. Con la prueba de los Contrastes, la 
limitación está determinada por aquellos contrastes que resulten ortogonales. 

Pruebas que involucran la comparación de todos los pares de medias. Tal como lo 
expresa la denominación con estas pruebas es posible comparar las medias de 
todos los grupos o tratamientos, bien sea que se trate de efectos sugeridos por 
los datos o que se considere un conjunto planeado. Se estudian en este caso las 
pruebas: 

Prueba de Scheffé 

Prueba de Student Newman y Keuls (S.N.K.) 

Procedimiento W de T ukey 

Prueba de Amplitudes Múltiples de Duncan 

Prueba t de razón k-bayesiana de Waller-Duncan 

Prueba de Gabriel 

Prueba de Bonferroni 


141 



Pr. Franklin Chacin 


Número de Repeticiones por Grupo (Tratamiento) 

Un aspecto muy importante a considerar al aplicar cualquier tipo de prueba 
de rango múltiple, es si el número de repeticiones para los grupos o tratamientos 
a ser comparados, es o no el mismo. Se desarrollaran cada una de las pruebas 
mencionadas bajo la suposición de que todos los grupos tienen igual número de 
repeticiones, sin embargo, se ofrece en algunos casos los ajustes necesarios para el 
caso de grupos con desigual número de repeticiones. 


Desarrollo de las Pruebas 


Contrastes 

Si se usa alguna prueba de significación para detectar diferencias reales entre 
tratamientos y se rechaza la hipótesis nula, sabemos que hay diferencias entre las 
medias pero no sabemos cuales son las medias o que combinación de ellas causan 
estas diferencias. Es por ello que en muchos métodos de comparación múltiple 
se utiliza la idea de un contraste. Esto conlleva a una combinación lineal de los 
totales de tratamientos con el objeto de hacer comparaciones planeadas. 

En la comparación de un experimento frecuentemente podemos preparar 
pruebas F para responder preguntas pertinentes. Esto involucra la partición de 
los grados de libertad y de la suma de cuadrados para los tratamientos en 
componentes de comparación. 

Estas comparaciones son independientes y por lo mismo ortogonales cuando: 

- la suma de los coeficientes de la comparación es igual a cero. 

- la suma de los productos de los coeficientes correspondientes a dos 
comparaciones es igual a cero. 

Las comparaciones o contraste son un conjunto de funciones lineales de la 
forma: 
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C = XC, y¡ con la restricción S C¡ = 0 


(7.1) 


donde y. pueden ser totales o medias de tratamientos. La suma de cuadrados de 
un contraste es igual: 


scc = 


Se. yi 
n Ec ? 


(7.2) 


donde n es el número de observaciones por tratamiento. Cuando el número de 
observaciones en cada tratamiento es diferente la comparación de las medias 
requiere que: 


S n¡C¡ = 0 

>=i 


(7.3) 


se tiene que: 


scc = 



y 

y. 

y 

~cT 


(7.4) 


Tal como fue mencionado, los y. pueden ser totales ó medias de tratamientos, 
los primeros son mas convenientes para las pruebas, los últimos para la estimación 
de intervalos de confianza. 


Una comparación tiene un grado de libertad así que t es la prueba apropiada, 
pero puede usarse F también. Para probar la hipótesis nula de que no existe 
diferencias entre los tratamientos generalmente es conveniente usar F y calcular el 
numerador a partir de los totales de tratamiento y el denominador la suma de 
cuadrados del error. 

Para probar un contraste se debe comparar la suma de cuadrados del 
contraste con el cuadrado medio del error. El estadístico que resulta tiene una 
distribución F con 1 y n-a grados de libertad. 


143 



Dr. Frankün Chacin 


Contrastes Ortogonales: Dos contrastes como los descritos anteriormente y con 
coeficientes C ; y D. respectivamente, son ortogonales si: 

a 

Z CjDj-0 (7.5) 

/=1 

o en el caso de repeticiones desiguales: 

a 

Z mCD. = 0 (7.6) 

;=i 

Si se tiene a tratamientos, el conjunto de a-1 contrastes ortogonales 
descomponen la suma de cuadrados de tratamiento en a-1 componentes 
independientes de un solo grado de libertad, por lo que las pruebas realizadas 
sobre los contrastes ortogonales son independientes. 

Los coeficientes de los contrastes deben ser elegidos antes de realizar el 
experimento y analizar los datos. Para elegir los coeficientes existen muchas maneras; 
las siguientes reglas son de utilidad en ese sentido: 

1. - Si se van a comparar dos grupos de igual tamaño, simplemente asígnense 
coeficientes +1 a los miembros de un grupo y -1 a los integrantes del otro grupo. 

2. - En la comparación de grupos que contienen distintos números de 
tratamientos, asígnense al primer grupo tantos coeficientes como número de 
tratamientos tenga el segundo grupo; y a este último tantos coeficientes del signo 
opuesto como número de tratamientos tenga el primer grupo. Entonces, si entre 
cinco tratamientos se quiere comparar los dos primeros con los tres últimos los 
coeficientes serían +3,+3,-2,-2,-2. 

3. - Redúzcanse los coeficientes a los enteros mas pequeños posibles. Por 
ejemplo, en la comparación de un grupo de dos tratamientos con un grupo de 
cuatro, en virtud de la regla 2, se tienen los siguientes coeficientes; 
+ 4, + 4,-2,-2,-2,-2 pero estos pueden reducirse a + 2, + 2,-1,-1,-1,-1. 

4. - Los coeficientes de interacción siempre pueden determinarse mediante 
la multiplicación de los coeficientes correspondientes a los efectos principales. 


144 



Piseñoy Análisis de Experimentos 7 


Método de Scheffé para comparar todos los contrastes 

En muchas situaciones no se sabe de antemano los contrastes que se desean 
comparar, ó se desea realizar mas de a-1 comparaciones. En muchos experimentos 
exploratorios, las comparaciones de interés son descubiertas solo hasta después 
de un examen preliminar de los datos. 

El método de Scheffé (1959) es muy general en el sentido de que todas las 
posibles comparaciones pueden probarse en cuanto a significancia o bien pueden 
construirse intervalos de confianza para las correspondientes funciones lineales 
de parámetros. Esto quiere decir que son permisibles infinito número de pruebas 
simultáneas, aunque solo se lleve a cabo un número finito, lo que da como resultado 
una tasa de error no mayor que la planeada. En este sentido el error tipo I es 
cuando mucho igual a p en cualquiera de las posibles comparaciones. 

Supongamos que se ha determinado un conjunto de m contrastes de las 
medias de tratamientos de interés que se designará 


r . = C i«l- l I +c h M 1 + -.- + C tu Jl, u= 1,2,... ,m (7.7) 

al contraste correspondiente usando los promedios de tratamientos y. es: 

C u = c ,u^l + C 2u ^ + ... + C u -p] u= 1,2,... ,m (7.8) 


Necesariamente, la prueba debe tener un valor crítico alto para la comparación, 
por ende el poder es bajo. El valor crítico para una comparación de la forma 
C ; y¡ exige el cálculo de C u , luego el error estándar de este contraste es: 


1 = 1 

Scu 


CMEE^CCy/nd 


(7.9) 


en donde n. es el número de observaciones del i-ésimo tratamiento. El valor 
crítico con que.C u debe ser comparado es : 


Sau = S cuA /(fl-l)F, 


a, a — 1 , n - a 


(7.10) 
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Para probar la hipótesis de que el contraste T y difiere significativamente de 
cero, hay que comparar C u con el valor crítico | C u | > S au la hipótesis nula de que 
el contraste T u es igual a cero debe ser rechazado. 

También puede usarse el procedimiento de Scheffé con el fin de construir 
intervalos de confianza para todos los posibles contrastes de las medias de 
tratamientos. Los intervalos de confianza construidos con este procedimiento, 
por ejemplo: 


C -S au <T <C +S au 

son intervalos de confianza simultáneamente verdaderos con un nivel de confianza 
de al menos 1-a. 


Prueba de las Mínimas Diferencias Significativas 

Es un procedimiento usado para comparar un conjunto de medias y también 
para comparar cada una de las medias de un conjunto con un tratamiento control. 
Este procedimiento fue traído a discusión por Fisher. 

El valor de mds (el cual representa las mínimas diferencias significativas) es 
igual al producto de la desviación estándar de la media por veces el valor de 

t al nivel de significación a escogido y con f grados de libertad asociados con la 
desviación estándar de la media. 


El mds es una forma de , 



Sd 


3a t y simbólicamente se podría establecer: 


(7.12) 


Sea la diferencia entre dos medias (x ; - x ; ' = d) el límite inferior de los 
valores que cabría esperar en un 5% ó mas de las veces al obtener muestras de 
diferencia de medias, donde la media |i d es igual a cero. Se sustituye d por mds 
y jJ, d por cero y la fórmula se transforma en: 

t = mds / s d 
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resolviendo por mds, se tiene: 

2 Si 2 Si ' 2 

mds = t s d ; donde Sd = + r-siendo Si 2 y Sj ' 2 las varianzas estimadas 

r¡ r¡ 

de los experimentos que reciban los tratamientos i e i' respectivamente, r¿y r- / 
son los números de unidades experimentales que reciben los tratamientos i e i' 
respectivamente. 

Todas las diferencias entre las medias son comparadas con el mds calculado. 
Si la diferencia excede el mds, se dice que las medias provienen de poblaciones 
con medias distintas. 

Una variación añadida a la prueba de t múltiple a un nivel a es el uso de F 
ó Z antes de realizar la comparación de medias, y si este muestra significación, 
entonces la prueba de t múltiple es realizada sobre las diferencias entre las medias; 
de lo contrario la prueba mds no debe ser usada para hacer comparaciones entre 
las medias. 

En conexión con estas pruebas de medias, Fisher estableció que los a-1 
grados de libertad provenientes de los a tratamientos pueden ser particionados 
en a-1 comparaciones ortogonales, cada una con un grado de libertad, y que es 
posible obtener una estimación de la varianza del error para cada comparación 
con un grado de libertad en un número de diseños de experimentos. 

La dificultad aquí estriba en que las varianzas de los errores usualmente está 
asociada con pocos grados de libertad; en consecuencia, la varianza combinada, 
con un mayor número de grados de libertad, es usada siempre que sea posible. 
También, mas de a-1 comparaciones ortogonales es usualmente lo deseado. 

El caso más extremo en el uso de la prueba mds, es el que compara la 
media mayor con la menor en un conjunto de a tratamientos. En este caso 
Pearson y Hartley (1966) mostraron que los errores tipo I páralos a tratamientos 
no es del 5% para a mayor que dos sino mucho mayor. 

El tamaño del error tipo I es igual a [1 - f P n (Q) ] donde f P n (Q) es 
obtenido a través de la siguiente expresión: 
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t P n (Q) = P (Q) + (l/f) a n (Q)+ (l-f 2 ) b n (Q) (7.14) 

donde P n , a n (Q), b n (Q) se obtienen de la Tabla 1 del trabajo mencionado 
de Pearson y Hartley. 

n = número de tratamientos 

f = grados de libertad asociados con el error experimental 

Q = V2 'a ;f 

t a . f = t de Student tabulado para un nivel de significación a y para los 
grados de libertad asociados con el error experimental (f) 

Cochran y Cox (1957) también indican que en la situación extrema en que el 
experimentador solo compara la diferencia entre la mas alta y la mas baja de las 
medias de los tratamientos mediante la prueba t ó mds, esta diferencia será 
probablemente considerable aún cuando no exista efecto. 

Ellos aseveran que puede demostrarse que con tres tratamientos el valor 
observado de t para la máxima diferencia será mayor que el valor tabulado al 
nivel del 5% en el 13% de las veces; con seis tratamientos la cifra es del 40%; con 
diez tratamientos es del 60% y con veinte tratamientos 90%. 

Así cuando los experimentadores piensan hacer una prueba t al 5%, en 
realidad la están haciendo a un nivel del 13% para tres tratamientos; 40% para seis 
tratamientos y así sucesivamente. 


Por lo tanto, la prueba mds para comparar las diferencias entre la mas alta y 
la mas baja de las medias, no puede ser usada para más de dos tratamientos en el 
experimento. 


En un análisis de varianza se supone que si s3 estima la misma varianza que 
s ; , 2 y que r ; es por regla general igual a r, por tanto: 


mds = t 
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donde s 2 es el cuadrado medio del error, r es el número de repeticiones y t es el 
valor tabular de t para los grados de libertad del error (f). 

Prueba de Student - Newman - Keuls 


En 1927, Student sugirió el uso de rangos como procedimientos para 
rechazar muestras que difieran en una serie de análisis. Newman hizo uso de las 
ideas de Student para subdividir un grupo de medias de tratamientos ordenados 
en subgrupos homogéneos y presentó tablas para ciertos valores de q donde: 


Xmax— Xmin 


Sx 


rango 


desviación, estándar 


(7.16) 


donde 

Xmax = la más alta de las medias 
Xmin = U más baja de las medias 
Sx- s / 


/^ es un estimado independiente de la desviación estándar de 
cada media si se tiene el mismo número de observaciones para los tratamientos 
y todas las desviaciones estándar son iguales. 


Las tablas de Newman fueron calculadas basadas en la ley de probabilidad 
aproximada de ordenamiento estudentizado de Pearson. Más tarde Pearson y 
Hartley realizaron una tabla similar a la obtenida por Newman. Las tablas fueron 
calculadas por métodos aproximados. May (1952) recalculó estas tablas con el 
fin de obtener resultados correctos con más cifras significativas. Esta tabla es 
reproducida en la Tabla F. 


Las últimas líneas (para infinitos grados de libertad) corresponden a los 
valores calculados por Snedecor (1946) y a los valores usados por Student (1947). 
La primera columna (n=2) puede ser obtenida multiplicando los valores de t a . f 
por ^¡2 • La tabla puede ser extendida para otros valores de a y otros grados de 
libertad tal como lo explica May (1952) en su trabajo. Es deseable tener más de 
diez grados de libertad asociados con la estimación del error experimental. Por lo 
tanto la parte de la tabla de May (1952) relacionada con menos de cinco grados 
de libertad es omitida. 
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Al aplicar la prueba de Student-Newman-Keuls (llamada así porque cada 
uno de ellos contribuyó a su creación) se deben seguir los siguientes pasos: 

1- Escoger un nivel de significación a, el cual usualmente será de un 5% ó 1%. 

2.- Calcular la desviación estándar del error Sx y los valores: 

— *1 a „ Sx 
W -l“Wl Sx 


^3 4 a j Sx 

W 2 = q cx, 2 5r = t a . f 7 2 Sx =mds 

3. - Ordenar las medias de los tratamientos desde la más alta a la más baja. 
Es decir: X n , X n l _ X 2 X 1; donde X n es la más alta y Xj es la más baja. 

4. - Comparar los rangos de los n tratamientos, (X n - X,) con los W n calculados 
■ Si X n - X t es mayor que W n se subdivide las medias en dos grupos de n-1 medias 
cada uno y se comparan los rangos X n - X, y X n4 - con W. y así sucesivamente. 

En forma más concisa el procedimiento se podría establecer como: “la 
diferencia entre cualquiera dos medias en un conjunto de n medias es significativo, 
si el rango de cada uno de los subconjuntos que contiene la media es significativo, 
de acuerdo a una prueba de rango escogida a un nivel a 

Prueba de Rangos Múltiples de Duncan 

Duncan (1955) propuso una prueba de rangos múltiples que combinan la 
simplicidad de la Prueba de Student-Newman-Keuls con las ventajas de potencia 
que su estadístico proporciona. Es decir, la prueba se aparta del procedimiento 
S-N-K en el cual se emplea un nivel de significancia constante en todas las etapas 
de la prueba. Para Duncan este nivel de significancia es variable y depende del 
número de medias que entren en la prueba. La idea es que a medida que el 
número de medias que se prueban aumenta, menor es la probabilidad de que se 
asemejen. 
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Si el rango es de dos medias se debe usar un a en general aceptable como 
0.05. Sin embargo, para tres medias l-(l-a ) 2 =0.0975 se sugiere usar 
a = 0.05; para cuatro medias l-(l-a ) 3 = 0.14; para t medias úsese l-(l-a ) t ' 1 . La 
tabla G se construye de acuerdo con este planteamiento, a partir de la distribución 
de amplitud “estudentizada”. 

De acuerdo a Duncan esta prueba permite al experimentador cometer 
menor error tipo II pero mayor error tipo I que con la prueba S-N-K. La 
prueba es esencialmente la misma que la S-N-K excepto que se utilizan tablas 
distintas. 

Prueba de Tukey 

En 1953, Tukey propuso un procedimiento de comparación múltiple que 
está basado en los intervalos. Este procedimiento hace uso de la amplitud 
“estudentizada” y es aplicable a pares de medias; necesita de un solo valor para 
juzgar la significancia de todas las diferencias. Es fácil y rápido de comparar ya 
que sólo se hacen comparaciones por pares. Este procedimiento requiere del uso 
de q a (a,f) el cual es el punto porcentual superior de tamaño a del intervalo 
“estudentizado” para grupos de medias de tamaño a y f grados de libertad del 
error. Este valor de q sirve para determinar el valor crítico de todas las 
comparaciones independientemente de cuantas medias estén en un grupo. 

Ya que solo se hacen comparaciones por pares, el valor crítico es menor que 
el exigido por Scheffé. El procedimiento consiste en el cálculo de un valor crítico 
mediante la ecuación: 


7=q (a,f) Sy, 

a 


(7.17) 


donde q a (a, f) es el punto porcentual y se puede hallar en la tabla de puntos 
porcentuales superiores de la amplitud estudentizada. Tabla F, en la cual a es el 
número de tratamientos y f corresponde a los grados de libertad del error. 


Syi 


CME 


(7.18) 


151 



Pr. Franklin Chacin 


Para que un par de medias se declare significativamente diferente 

\yt-yj I > Ta (7.19) 

La prueba de Tukey tiene un nivel de error tipo I de a para todas las 
comparaciones con base en cada experimento. En consecuencia la prueba de 
Tukey tiene menos poder que el procedimiento de Duncan o de Student- 
Newman xVeuls. 


Esta prueba también puede usarse para cálculos de un conjunto de intervalos 
de confianza para las diferencias. La verdadera diferencia entre medias 
poblacionales estimados por y¡ y yj se estima mediante: 

IC = \yi-yj | ± Ta (7.20) 

Prueba de Dunnett para la comparación de todas las medias con un control 

Probablemente uno de los casos más frecuentemente encontrados es la 
comparación de un control con cada tratamiento. Por ejemplo, en medicina 
como también en las industrias se podría desear probar varias drogas nuevas y 
compararlas con una droga estándar. 

Suponga un conjunto de datos a los que se les ha realizado un análisis de 
varianza, la cual no es necesaria como parte del procedimiento de comparaciones 
múltiples pero es una forma conveniente de obtener la varianza del error, la cual 
es requerida para los cómputos a realizarse. 


Asuma que uno de los tratamientos es el control. El primer paso es calcular 
la diferencia de todas las demás medias con la media del tratamiento control. 


/ Ya que la varianza de cada observación se supone s la varianza de la media 
donde n es el número de repeticiones. La varianza de la diferencia entre 


/ ri . 9 o 2 / . ., , 

dos tratamientos es AS / y su desviación estándar es: 

/ V) J 


Sd ~ 


2s 2 


(7.21) 
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cuando hay solo dos medias a comparar se puede utilizar el estadístico “t” de 
Student, donde: 

d 

“7 722 ) 

y el intervalo de confianza sería d ±t.Sd- Note que las comparaciones no serían 
independientes, a juzgar por el criterio de los contrastes ortogonales. Para obtener 
una prueba de significación conjunta, Dunnett construyó tablas “t” 
correspondientes al número de tratamientos a ser comparados con el control 
(ver Tablas H). 

Mientras mayor sea el número de tratamientos mayor es el valor t de Dunnett 
(dut). Obviamente cuando un solo tratamiento ha de ser comparado con el 
control, el estadístico t de Dunnett es idéntico al estadístico t de Student. 


Las conclusiones que se obtengan simultáneamente al aplicar esta prueba 
tendrán una probabilidad de ser correctas de 0.95. 

Como es costumbre, los intervalos de confianza también podrían ser 
obtenidos para las diferencias de las medias con el control. Filas son: d ± dut s<i ■ 
donde dut es el estadístico tabulado de Dunnett al nivel de confianza deseado. 


Algunas veces el experimentador está solo interesado en saber si el tratamiento 
en cuestión es mayor que el control. Estas serían las llamadas pruebas de una cola 
y los intervalos de confianza serían d - dut.Sd -Las tablas de los duts de Dunnett 
para las comparaciones de una sola cola están dados en la tabla I. 


Si en el experimento hay alguna forma de bloqueo que pudiese ser 
considerado aleatorio en lugar de efecto fijo; el modelo del análisis de varianza 
sería mixto. Esto hace apropiado para la varianza del error el cuadrado medio 
de la interacción, para las comparaciones de los tratamientos. La prueba de 
comparaciones múltiples sería: 


t = 


Xí - Xo 



m rio 


1/2 


(7.23) 
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S = la raíz cuadrada del cuadrado medio de la interacción 

X, = media del tratamiento 

Xo = media del control 

rit = número de repeticiones en el tratamiento 

no = número de repeticiones en el control 

Por supuesto para obtener el t de Dunnett (dut) se busca con los grados de 
libertad asociados a la interacción. Es de notar que se parte del supuesto de que 
los grupos tienen la misma varianza. En algunos casos éste supuesto puede ser 
bastante razonable; pero sin embargo la varianza del grupo control podría ser 
significativamente mas pequeña que la de los tratamientos, en estas circunstancias 
las varianzas de los tratamientos y del control pueden ser calculados en forma 
separada, en este caso el estadístico t apropiado sería: 

Xt - Xo 

Tñ 


donde: 

Si 2 = varianza de los tratamientos 
So 2 = varianza del control 



Sí So 

ru rio 


El valor del estadístico t de Dunnett (dut) se busca con los grados de libertad 
ponderados de las varianzas involucradas. El valor dut que se encuentra tabulado 
se ajusta por la desigualdad de las varianzas a través de la fórmula: (Dunnett, 
1964) 


nt.So 2 
no. Si 2 


(7.25) 


Construcción de las tablas de Dunnett 

Los métodos para determinar los valores tabulados de t fueron los mismos 
para calcular los valores de dos colas ó de una sola cola. Todos los cálculos 
fueron hechos por computadora (los programas fueron hechos por Dunnett en 
una LPG30 usando subrutinas para la distribución normal escritos por R. A.Lamn). 
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Los cálculos involucraban la evaluación numérica de una integral doble. 
Para cada valor de p mostrado en la tabla y para los grados de libertad 5,10,20 
e infinito; esta integral doble fue evaluada numéricamente para tres valores sucesivos 
de t difiriendo en 0.05 tal que el valor deseado de p fuese acotado. Entonces, el 
valor de t fue determinado fijando una curva de 3 puntos y el resultado fue 
chequeado calculando directamente el valor de p. Para grados de libertad 
intermedios los valores tabulados fueron obtenidos por interpolación. Los 
resultados obtenidos fueron redondeados a dos cifras decimales tal como aparecen 
en las tablas. 

Prueba de Gabriel 

Esta prueba fue desarrollada en la Universidad hebrea en Jerusalén, Israel 
por K.R. Gabriel. El procedimiento fue designado con las siglas STP que 
representan en inglés SIMULTANEOUS TEST PROCEDIERE y que en español 
significa PROCEDIMIENTO DE PRUEBAS SIMULTANEAS. El 
procedimiento se propone probar la homogeneidad de todos los conjuntos de 
medias involucradas en el análisis de la varianza. Las decisiones de significación 
están basadas en las sumas de cuadrados entre medias que están en un conjunto, 
se usa el mismo valor crítico como el usado para el test F. 

Se dice que las decisiones son transitivas en el sentido de que cada subconjunto 
que contenga otro subconjunto significativo es por sí mismo significativo. Sin 
embargo, las decisiones serían incompletas en el conjunto que pueda ser significativo 
pero no contenga ningún subconjunto significativo, en este caso no se puede 
inferir heterogeneidad en el conjunto con el grado de confianza especificado. 

Un ejemplo de la utilidad de un STP es donde un conjunto de medias es 
juzgada como significativamente diferentes, pero se sospecha falta de 
homogeneidad en las varianzas del conjunto. 
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Descripción de i'aprueba STP 


Se asume que los siguientes datos están disponibles para k poblaciones: x i > 
xi^-xk son medias normales e independientemente distribuidas con varianzas 


<7 


m 


' , ~ >respectivamente,siendo m, m, — > m conocidas 

Sesconocidóf se tiene también s 2 un estimado independiente e 


conocidas 


pero cr es 
insesgado de ¿j 2 con no grados de libertad. 


Cada conjunto p de todas o algunas de las k poblaciones se juzga como de 
varianzas significativamente diferentes, si y solo si: 

(7.26) 


c 2 c 2 
bp > b 


k -1 


F a{k - !;/io) 


donde F «(* - i ; «„) es el punto superior de a de la distribución F con k-1 y no 
grados de libertad y s P 2 es la suma de cuadrados para la hipótesis de homogeneidad 
de las varianzas de las poblaciones en p. Entonces: 


Sp^&ÍXi-Xp) 2 (7.27) 

P* 

x P = Xn¡.Xi/hp (7.28) 

i 

n P = X n ' (7.29) 

P ‘ 

donde ^ denota la sumatoria sobre todas las muestras de la población en p. 

i 

Prueba t de Razón Bayesiana de Waller-Duncan 

En 1975, Duncan en su afán de perfeccionamiento de los procedimientos 
para realizar comparaciones múltiples de medias, con la colaboración de Waller 
propuso la siguiente prueba. Esta prueba se caracteriza porque no interviene un 
nivel de significancia, en lugar de esto se escoge una gravedad o peso del error 
tipo I ó tipo II. Se aconseja razones de 50:1, 100:1, 500:1, en vez de a = 0,10; 
0,05 y 0,01. 


75<5 





La tabla que se deduce para ser utilizada contienen valores t de nesgo mínimo 
para k= 100. Estos son los únicos valores presentados allí. La tabla se consulta 
con base en el valor para el contraste F de tratamiento por lo cual se calcula el 
valor de b, de acuerdo a la expresión; 

(7.30) 

Luego se va con q = f t = grados de libertad de tratamiento y f = f = 
grados de libertad del error. Este valor crítico el cual se presenta en tablas y 
luego se sustituye en la expresión. 



mds=ts d ( 7 . 31 ) 

donde mds es el valor con el cual van a ser comparadas todas las diferencias de 
medias. 


Es conveniente hacer notar que la prueba F global que se usa como regla de 
decisión para el análisis de la varianza cuando se analizan las k poblaciones. La 
probabilidad de que simultáneamente ningún conjunto de poblaciones es 
significativamente no homogéneo es de al menos 1-a. En otras palabras, la 
probabilidad de que sea cometido error tipo I es como máximo a. 

Todos los cálculos realizados por Gabriel para la realización de esta prueba 
e incluso un ejemplo numérico es proporcionado en el artículo “Testing 
homogeneity of all sets of means de Gabriel, pero no serán incluidos en este 
trabajo. Sin embargo, es importante notar que el autor sugiere en este artículo que 
el uso conjunto de la prueba de Scheffé y STP es deseable debido a la similaridad 
de los procedimientos utilizados en ambos. 

Ejemplo Ilustrativo 

Se presenta un ejemplo ilustrativo, al cual se le aplica todas las pruebas de 
comparaciones de medias consideradas en el presente capítulo. 

En un experimento se estudió el efecto de diferentes concentraciones de 
Aroclor 1254, (un bifenil policlorinado; BPC) sobre ratones enjaulados, a los 
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cuales se les administró el medicamento a través de los alimentos consumidos ad- 
libitum. El objetivo fue determinar la mejor dosis de sustancia, es decir aquella 
que produzca la mayor actividad hepática (desdoblamiento en el hígado de 
sustancias extrañas al organismo en el menor tiempo posible). Después de dos 
semanas de iniciado el experimento, los ratones fueron inyectados con Nembutal 
(anestésico) y se registró para los sobrevivientes, el tiempo que permanecieron 
dormidos. El tiempo dormido es una medida de la actividad de la enzima 
microsorual hepática. Los resultados se muestran a continuación en la tabla 7.1. 

Tabla 7.1. Datos en el ejemplo ilustrativo para comparaciones de medias 

Dosis de BBC Tiempo Dormido 

(Tratamientos) (min) 


1 

0,0 

55 

47 

46 

53 

2 

62,5 

47 

51 

40 

44 

3 

500,0 

49 

44 

46 

51 

4 

1000,0 

36 

41 

40 

38 


Contrastes Ortogonales 

Como se tienen 4 tratamientos, se pueden efectuar 3 contrastes a saber: 

//3 + y/4 = ju\ + /ai 
/ai + //4 = ju\ + fj. 3 
//i + jua - /ai + y/3 


Por lo tanto: 


Los coeficientes (Ci) 

-1 -1 +1 

-1 +1 -1 

+1 -1 -1 


C.--Y 1 -Y 2 + Y 3 + Y 4 
C2 = -Yl+Y2-Y3 + Y4 
C 3 = "H Y 1 ■ Y 2 Y 3 + Y 4 


en estos casos son: 
+ 1 
+ 1 
+ 1 
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los cuales cumplen con las condiciones de que C¡ = 0 y además ^ C¡Cj = 0 
para . Se conoce, partiendo de los datos de la tabla 7.1 que los totales de 
tratamiento (dosis) son: Yi. = 201, Y 2.= 182, Y 3 .= 190, Y 4 = 155, N=16, 
a = 4, N-a=12. 

Luego: 


C, = (-1)(201) + (-1)(182) + (+1)(190) +(+1)(155) = -38 
C 2 - (-l)(201) + (+l)(182) + (-1)(190) + (+1)(155) = -54 
C 3 = (+l)(201) + (-1)(182) + (-1) (190) + (+1) (155) = -16 

Ahora, si n=4 (observaciones/trat) y 

(Z C ¡Y .) 2 

SCC= V - ^ ■’ 

para el primer contraste resulta: 

(—38) 2 

SCC! = —=90,25 
16 

para el segundo contraste: 

SCC2 = = 182,25 

16 

finalmente para el tercer contraste: 

(-16) 2 

SCC3 = Y—2- - 16,00 
16 

Se calcula a continuación el valor de F a partir de la siguiente expresión: 

C¡ 


Fcal — ' 


(CMEE) 


1/2 


lo’ 

_ 

nj 
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Se obtiene el siguiente análisis de la Varianza: 


Fuente 

g de L 

SC 

F 


Tratamiento 

3 

288,5 

6,89** 


Error 

12 

167,5 



Total 

15 

456,0 




Se compara el F tabulado (0,05;1,12) = 4,75 con el Fcalculado. El 


El CMEE = 13,9583 para todos los contrastes. Los valores de F calculados 
para cada contraste respectivamente: 

38 56 

Fi= ... .17 F2= __ =14,99 


F 3 = 


(13,< (13,9583) 
16 


(13,9583) 


-1017 
3) 

= 4,28 


(3,736) 


Al comparar los F calculados con el F tabulado se obtiene: 
6,46 >4,75 Se rechaza H 

J 7 O 

13,056 > 4,75 Se rechaza H o 
1,146 < 4,75 No se rechaza H o 

por lo que se puede concluir que: 


//3 + //4 & //i + //2 

//2 + //4 i=- jU\ + jui 
//i 4 /24 = fii + m 

Ahora es necesario observar si en la práctica, existe la posibilidad de combinar 
la dosis de los tratamientos sin afectar la respuesta de los individuos. 
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Para efectuar la prueba de Scheffé es necesario plantear todos los contrastes 
posibles entre las medias o solo aquellos contrastes de interés para el investigador. 
En este caso todos los contrastes posibles son: 


llo'.fiX - //2 = 0 Ho\ ¡ti — jU'i = 0 Ho.f.1 1 — //3 = 0 

Ho.jui - /ja = 0 Ho\ ¿j\ - ¿¿A = 0 Ho\jU 3 - //4 = 0 


Se analizará solo un caso: Ho. y\ - //3 = 0 . En este caso el contraste C 
viene dado por la expresión: 


luego se calcula: 


Cu — (+l)y i + (0) y 2 + (-l)y3 + (0) y 4 = 2.75 


S cu = CMEE¿(Ciu 2 /n,) 


S cu = Jl 3.95831 


l 2 +0 2 +l 2 +0 2 


finalmente se calcula: 


= 2.64 


S ceu — Scu -yj (a.— Y)Fa t a- 1, N- a 

S« = 2.64^3(3,49) = 8.54 

Como Cu < Sau no se rechaza la hipótesis nula. Ello indica que los 
tratamientos 1 y 3 no son estadísticamente diferentes. De igual forma pueden 
efectuarse las restantes comparaciones. Una vez obtenidos estos contrastes se 
concluyó que no existe diferencia entre los tratamientos 1,2 y 3. Sin embargo la 
dosis de BPC= 1000 (tratamiento 4) si produce un efecto significativamente 
diferente del resto disminuyendo significativamente el tiempo de recuperación de 
los ratones. 
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Prueba de la Mínima Diferencia Significativa (mds) 


El valor crítico para la prueba viene dado por: 


mds -tal 2$i- a.(Sd) = t al 2,N- a.. CMEE! 


CMEE 

' i r 

i 

n¡ n¡ _ 


13.95 

'i r 

\ 

|_4 A\ 


mds = 2.179^62475 = 5.75 


Si y¡ — yj.| >5.75 se concluye que las medias de los tratamientos 
involucrados en la comparación (i,j) son estadísticamente diferentes. Si se realiza 
la operación solamente para Ho. jU\ — /ut> = 0, las medias de los tratamientos 1 y 
3 respectivamente resultan estadísticamente iguales ya que: 


|y i- - y 3-| = 2.75 < 5.75 


Este proceso se puede repetir para el resto de las comparaciones y así generar 
los grupos de medias como se verá posteriormente. 


Prueba de Student-Newman -Keuls (S.N.K.) 

Esta prueba consiste en subdividir un grupo de medias de tratamientos 
ordenados en subgrupos homogéneos. El procedimiento se basa en calcular un 
conjunto de valores críticos. 


- Se escoge un nivel de significación a, en este caso 0,05 

- Se calcula el valor Sy 

n/2 

= 1.868 


’CME" 

1/2 

"13.9583" 

n 


4 


- Se busca en la tabla F correspondiente a los valores de q para 
cc=0,05y n = 2,3,4. 



q o,o5(2,i2) = 3,08 
q o,o5(3,i2) = 3.77 
q o,o5(4,i2) = 4,20 


Diseño y Análisis de Experimentos 7 


- Luego se calcula W; donde W = q a( P , i) S¡¡ 

W 2 = 3,08(1,868) = 5.75 
Ws = 3,77(1,868) = 7,04 
W 4 = 4,20(1,868) = 7,84 


- Se ordenan las medias de los tratamientos en orden descendente y se 
comparan las diferencias de todas las combinaciones con su respectivo valor de 
W y se obtienen los grupos homogéneos. 

yi. y 3. y 2. y 4 . 

50.25 47.59 45.50 38.75 

B A 


Por ejemplo, la diferencia entre las medias de los tratamientos 2 y 4 es mayor 
que el valor de jy 2 > de allí que aparezcan en grupos diferentes. La diferencia 
entre las medias de los tratamientos 1 y 2 es menor que el valor de Wi P or 1° 
tanto aparecen en un mismo grupo, y así sucesivamente. 

Prueba de Duncan 

Duncan propuso una prueba de rangos múltiples donde se debe calcular: 


"CME" 

1/2 

"13.9583" 

n 


4 


1.868 


y luego los valores de la tabla de r (Tabla G) correspondientes al número de 
medias involucradas en la comparación, obteniéndose: 
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r o,o5(2,i2) = 3,08 
r o,o5(3,i2) = 3,23 
r o,o5(4,i2) = 3,33 

Luego se calcula V; donde V = Sy; 

V 2 =3,08(1,868) = 5.75 
V 3 = 3,23(1,868) = 6,04 
V 4 = 3,33(1,868) = 6,22 

De forma similar al procedimiento descrito para la prueba anterior se 
comparan las diferencias entre las medias con su respectivo valor crítico (V) para 
formar los grupos homogéneos. 

yi. y3. y 2 , y4. 

50.25 47.59 45.50 38.75 

B A 


Prueba de Tukey 

En la prueba de Tukey se necesita de un solo valor para juzgar la significación 
de todas las diferencias y las comparaciones se hacen por pares. Se requiere de: 

q a(a, jy. punto porcentual 

a: tamaño del grupo de medias 

f; grados de libertad del error experimental 

El procedimiento consiste en calcular: 

Ta — C¡a(d, í) Sy; 

Si a = 4, f=N-a = 16-4 = 12,£¡r = 0,05 ;q 0,05(4,12) = 4,20; este valor 
se busca en la tabla F. Sustituyendo: 

Ta = 420(1. ,868) = 7,8456 
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Luego para declarar un par de medias significativamente diferentes debe 
ocurrir que |y¡—y¡| > Ta 


Comparación Diferencia 
(Pares) |y¡- y¡| 

Ta 

1-3 

2,75 


1-2 

4,75 


1-4 

11,50 

>7,8456* 

2-3 

2,00 


2-4 

6,75 


3-4 

8,75 

>7,8556* 


Luego se concluye que los pares de medias de los tratamientos (1 y 4) y 
también (3 y 4) tienen diferencias significativas. 


Prueba de Dunnett 

En esta prueba se comparan todas las medias con un control. En este 
ejemplo ilustrativo, se considera el tratamiento 1 como el tratamiento control y 
los otros tres tratamientos se comparan con el. El valor crítico a calcular es; 

d^-i^/cMEE (%, + %.) 

Los valores de d pueden ser obtenidos de la tabla H. De allí se obtiene el 
valor d 005(412) = 2,88. En este ejemplo: 

d J 13 > 9583 ( 1/4 + 1/4 ) = 2,88 Jl3,9583/2 = 7,085 

0,05(4,12) V 7 V 

Es de notar que |y 4 - y i| = 11,50 es mayor que el valor crítico, por lo tanto 
//4 y ju\ son estadísticamente diferentes. De igual manera, se analizan el resto de 
los pares de medias que se comparan con el control. 
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Prueba de Waller-Duncan 

El valor crítico en esta prueba se obtiene con los siguientes datos: 

g .1. = grados de libertad de tratamiento = 3 
f = grados de libertad del error experimental = 12 

k= 100 


Cuyo valor F será tomado para buscar los valores en la tabla titulada “Valores 
de t de riesgo promedio mínimo Duncan-Waller”. 


q = 3 (g.l.trat) 
f = 12 (g.l.error) 

En la tabla se obtienen 

F = 6 
F = 6,89 
F= 10 


t = 2,22 
t=? 

t = 2,125 


Interpolando se obtienen t = 2,19875. Luego la mínima diferencia 
significativa para esta prueba es: 

m.d.s = t.sd = 2,198^13,95(1 / 4 +1 / 4) = 5,8087 

Al colocar las medias en orden descendente, se puede notar que el tratamiento 
4 difiere considerablemente del tratamiento 2 y por ende del resto de los 
tratamientos. En este caso al comparar tratamiento 4 y tratamiento 2, la diferencia 
entre las medias es 6,750, el cual es mayor que el valor crítico calculado 5,8087. 
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Tabla 7.2. Cuadro Comparativo de los Resultados de las Comparaciones de 
medias 


Comparaciones Tukey Scheffé mds 


1-2 

1-3 


1- 4 

2- 3 

2 - 4 

3 - 4 


ír ír 


** 


** 

Tabla 7.3. Cuadro Comparativo por grupos de tratamiento 

Trat 

Scheffé 

mds 

SNK 

Duncan 

Tukey 

Waller 

1 

A 

A 

A 

A 

A 

A 

3 

A 

A 

A 

A 

A 

A 

2 

B A 

A 

A 

A 

B A 

A 

4 

B 

B 

B 

B 

B 

B 


Se puede concluir que invariablemente en todas las pruebas /a\ = fti — /a ; 
e igualmente jU\ T // 4 , //3 fj.A. 

En las pruebas de Scheffé y Tukey, fui no es significativamente diferente de 
//4 , sin embargo m.d.s.., SNK, Duncan y Waller-Duncan si detectan diferencias 
entre ellas. 

Otra característica a destacar es que /¿t es significativamente diferente de 
las otras medias en la mayoría de las pruebas, pero es de considerar que la dosis 
asignada a este tratamiento es considerablemente superior a los otros tratamientos. 




Capítulo 8 

EXPERIMENTOS FACTORIALES 


Introducción 

En experimentación podemos hablar de dos procedimientos de uso común. 
Uno que estudia el efecto determinado por diferentes cantidades de un simple 
factor variable, estableciéndose un control a niveles constantes del resto de los 
factores actuantes. Es lo que comúnmente se conoce como experimentos de 
factor único. Por ejemplo, tenemos la comparación de variedades de un cultivo, 
o la determinación de la mejor distancia de un cultivo, entre otros. El otro tipo 
de experimentación corresponde a aquellos experimentos que investigan 
simultáneamente los efectos de diferentes factores, conocidos como 
experimentos factoriales. 


Estos procedimientos han sido usados y se usan en las ciencias experimentales 
dependiendo en general de los objetivos de la investigación. En la investigación 
de los fenómenos biológicos el uso de los experimentos factoriales es más 
generalizado que en los físicos por la misma esencia de dichos fenómenos; su 
complejidad en términos de relación efecto-causas actuantes. Así, por ejemplo, la 
producción de un cultivo depende de una serie de factores tales como: fertilidad 
del suelo, humedad del suelo, condiciones climáticas (temperatura, precipitación, 
humedad relativa, entre otros), densidad de siembra, métodos culturales, capacidad 
genética de la variedad, entre otros, que por lo general interactuan. 

Se puede estudiar el efecto de cada factor por separado cuando los otros se 
mantienen a niveles constantes, pero este procedimiento de factor único no daría 
información sobre la dependencia del efecto del factor sobre los niveles de los 
otros factores; mediante el segundo procedimiento; es decir, los experimentos 
factoriales, es posible conocer si cada factor ejerce un efecto independiente del 
resto de los factores variables o si su efecto está relacionado a los cambios de 
niveles de otros factores. 


169 



Dr. Franklin Chacin 


El concepto de experimentos factoriales está en realidad restringido a un 
tipo especial de diseño de tratamiento que implica todos los tratamientos posibles 
resultantes de combinar cada uno de los niveles de los diferentes factores en 
estudio; es decir, que en el diseño de tratamiento conocido como factorial, cada 
uno de los posibles tratamientos es una combinación particular de un nivel de 
cada uno de los factores en estudio. En este sentido cabe hacer diferenciaciones 
con otros diseños de tratamiento que aun cuando un tratamiento es una 
combinación particular de un nivel de cada factor, no entran en el experimento 
todas las combinaciones posibles. 

La denominación de experimentos factoriales completos sería adecuada 
para el caso en que el factorial se estudie en todas sus posibles combinaciones y 
experimentos factoriales incompletos cuando algunas combinaciones de interés 
del factorial serán seleccionadas para el experimento. Existen ciertos diseños de 
tratamientos que aun cuando se estudia más de un factor no entran en la definición 
de experimentos factoriales; es el caso, por ejemplo, de experimentos con varias 
drogas, cada una a varios niveles, pero cada nivel de una droga es un tratamiento; 
es decir, los niveles de cada droga no se combinan para formar un experimento 
de tipo factorial. Estos experimentos pueden ser denominados seudofactoriales. 

Factores, Niveles, Clasificación de los factores 

Factores: Un factor en término estricto sería una causa o variable independiente 
que puede variar a voluntad del experimentador. Sin embargo, es una connotación 
convencional para designar una clase de tratamiento o cualquier proceso o 
manipulación que interviene en un tratamiento. En un factorial sería cada uno de 
los tratamientos básicos que intervienen en la formación de una combinación de 
tratamientos. Una distinción que usualmente se hace entre factores es con base en 
la definición de tratamiento. En este sentido, si un tratamiento es cualquier proceso 
o condición que es aplicado a una unidad experimental y además la aplicación de 
los tratamientos en las unidades está bajo el control del experimentador, entonces 
se distinguen factores de tratamiento propiamente dichos como aquellos aplicados 
directamente a la unidad experimental y factores de clasificación cuando las 
unidades experimentales se clasifican en dos o más tipos de clases. 
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Niveles: El término niveles hace referencia a las diferentes clases, dosis o 
cantidades de un factor. Un nivel puede ser entonces una clase, estado o cantidad 
particular de un factor. Por ejemplo, si se van a comparar varias variedades de un 
cultivo, el factor es la variedad y las diferentes variedades son los niveles del factor 
variedad. Si se estudia el efecto de nitrógeno sobre el rendimiento de un cultivo, 
el factor es el nitrógeno y las diferentes dosis o cantidades aplicadas del mis mo 
son los niveles. 

Cldsifkaaóndelosfoctores.-'Es conveniente clasificarlos factores en los siguientes tipos: 

Factores Cualitativos Específicos. Son aquellos en que los niveles no siguen un 
orden natural y cada nivel es de igual interés. Por ejemplo, diferentes variedades 
de un cultivo en un ensayo de variedades, diferentes métodos de siembra, etc. 

Factores Cuantitativos. Los diferentes niveles se expresan en valores numéricos 
definidos que corresponden a determinadas cantidades de la variable bajo estudio. 
Por ejemplo, diferentes cantidades de nitrógeno en un ensayo de fertilizantes, 
diferentes densidades de siembra en un ensayo de población, etc. 

Factores Cualitativos Ordenados. Los niveles del factor se arreglan en algún 
orden pero no hay una variable cuantitativa natural que describa los niveles o 
factores cuantitativos en los que los diferentes niveles no corresponden a valores 
bien definidos sino mas bien a valores agrupados. Por ejemplo, muchos factores 
de clasificación pertenecen a este grupo; los suelos de un área experimental pueden 
ser clasificados en áridos, de fertilidad baja, de fertilidad media y muy fértiles. Se 
puede clasificar un lote de novillos en flacos, medianamente flacos, gordos y muy 
gordos, de acuerdo a algún agolpamiento previo de sus pesos. 

Factores Cualitativos Muéstrales. En algunos casos los niveles cualitativos usados 
no son de mucho interés en sí, sino como una muestra de una población de 
niveles. Por ejemplo, experimentos repetidos en varios lugares o en varios años, 
en los que se supone que los sitios escogidos serán una muestra de los lugares 
donde se harán las recomendaciones finales del experimento y los diferentes años 
son una muestra de los diferentes años por venir. 
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Se pueden clasificar los factoriales de acuerdo al número de factoresyal número 
de niveles que intervienen de la siguiente manera: 


Grupos de p k , es decir, k factores todos al mismo número de niveles p (la 
base indica el número de niveles y el exponente el número de factores) 


2 k (2 2 ;2 3 ;2 4 ;...) k factores a dos niveles: k = 2,3,... 

2 k (3 2 ;3 3 ;3 4 ;...) k factores a tres niveles: k = 2,3,... 

4 k (4 2 ;4 3 ;4 4 ;...) kfactores a cuatro niveles: k = 2,3,... 
entre otros... 


Grupos (p x q x s x ....); es decir, distintos número de niveles. Para cada 
factor 2 x 3 un factor está a dos niveles y el otro a tres. En el caso (3x3x4) dos 
factores están a tres niveles y el otro a cuatro y así sucesivamente. 

En el caso de dos factores, digamos A y B cada uno a dos niveles; 
(a o ; a,); (b u ; b,); el factorial se indicaría como un 2 2 y constaría de cuatro (4) 
posibles combinaciones de tratamientos, representados como: 

( a A) 

(a„b,) 

(a,b 0 ) 

(a,b,) 

El análisis factorial implica un análisis de los efectos de los factores a fin de 
constatar si el efecto de un factor es independiente del otro factor o por el contrario 
existe interacción. 

Efectos Simples, Efectos Principales, Interacción 

El incremento de A desde a o a a,, vendrá dada por la diferencia 
(a, - a o ); así tenemos dos efectos de A para cada nivel de B. 

Efecto de A al nivel b 0 = a,b 0 -a 0 b 0 = A, (8.1) 

Efecto de A al nivel b, = a,b, — a o b, = A, 


172 


( 8 . 2 ) 



_ Diseño y Análisis de Experimentos 3 

Estos efectos de A a cada nivel de B se llaman efectos simples de A. En 
forma alternativa: 

Efecto de B al nivel a o = b,a o -b o a o = B, ( 8 . 3 ) 

EfectodeAalnivel a, = b ] a 1 -b o a, = B 2 ( 8 . 4 ) 

Si los efectos simples de A a los niveles b 0 y b, son iguales decimos que el 
efecto de A es independiente de la acción de B. Esto es, A, = A,. 


De manera que una estimación del efecto de A sería dada por el promedio 
de los efectos simples; y se denomina efecto principal de A. 

1 

A = 2^ aib|-a ° b I + a i b o~ a ° b o) (8-5) 

A = ^( ai -a 0 )(b, + b 0 ) 

De igual manera, el efecto principal de B vendrá dada por el promedio de sus 
efectos simples. 

B = ^( a i b .- a ibo + a 0 b ] -a o b 0 ) (8-6) 

B = |(a, + a 0 )(b 1 -b 0 ) 

Si los factores A y B se influyen mutuamente los efectos simples diferirán, es 
decir A, ^ A 2 o B, B 2 y esta diferencia será una medida de la interacción 
de los factores. Así definimos la interacción como: 

AB = ^{ ( a ib, — a 0 b,) (a,b 0 -a o b 0 ) } ( 8 . 7 ) 

AB = |(a l -a 0 )(b,-b 0 ) 

BA = |{ (a J b,-a I b 0 )-(a 0 b,-a ü b 0 ) ¡ 

1 

BA = — (a.-a )(b,- b.) 

2 v oA 1 °' (8.8) 
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Lo anterior indica que AB = BA, por lo tanto la relación es simétrica. La 
interacción es la misma tanto si la consideramos desde el punto de vista del factor 
A como del factor B. 

Véase ahora numérica y gráficamente mediante observaciones ficticias, la 
presencia o ausencia de interacción. Se asume la no existencia de variación no 
controlada. 

No Interacción 


Factor B 


Niveles 

b 

b, 

b, -b 

Factor A 

a 

30 

32 

2 


a i 

36 

38 

2 


a, - a 

6 

6 








Factor B 



Niveles 

b 

b i 

b - b 

Factor A 

a 

10 

12 

2 


a i 

13 

15 

2 


a. - a 

3 

3 








Con Interacción 


Factor B 



Niveles 

b 

b, 

b - b 


Factor A 

a 

30 

32 

2 



a , 

36 

44 

8 



V a o 

6 

12 
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Factor A 


Niveles 


b b b - b 

o 1 lo 

a 0 30 32 2 

a t 36 26 10 

a. - a 6 -6 

1 o 



Hay interacción Hay interacción 

(cambio de magnitud) (cambio de dirección) 

Fig 8.1 Representación Gráfica de la presencia o ausencia de Interacción de 
los factores en un Experimento Factorial. 

En el análisis de los resultados de un factorial 2 2 tal como fue descrito 
anteriormente, es necesario estimar los efectos principales y la interacción AB. Si 
no se detecta interacción los efectos principales serían entonces las mejores 
estimaciones de los efectos y sobre los cuales se basarían las interpretaciones de la 
investigación, en caso contrario es necesario examinar e interpretar la naturaleza 
de la interacción. 
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Los efectos A, B y AB satisfacen las condiciones para un conjunto ortogonal 
de comparaciones. La siguiente matriz ortogonal puede servir para calcular los 
efectos medios y la suma de cuadrados asociada a cada efecto. 

Tabla 8.1. Matriz Ortogonal. 

Efecto Divisor Divisor Contribución 

Factorial Totales de Tratamiento parala parala delaS.C.de 

media S.C. tratamiento 



(1) 

a 

b 

ab 

2^-1 

ríe 2 


A 

-1 

i 

-i 

i 

2.r 

4.r 

[A] /4.r 

B 

-1 

-i 

i 

i 

2.r 

4.r 

[B] /4.r 

AB 

1 

-i 

-i 

i 

2.r 

4.r 

[AB] /4.r 


[ A ] es el efecto factorial total de A y viene dado por la función: 


[A] = XTiC, = [_ (i) + (a) _ (b ) + (ab)] (8.9) 

donde T¡ es el i-ésimo total de tratamientos representados en nuestro caso por 
(1), (a), (b), (ab). C son los coeficientes que permiten cumplir con el propósito 
de comparación y órtogonalidad. Así el efecto principal promedio A se estima 
como: 

[A] / 2.r = [- (1) + (a) - (b) + (ab)] / 2 r (8.10) 

donde r es el número de repeticiones del experimento. En el Análisis de Varianza, 
la contribución del efecto Principal de A a la suma de Cuadrados de Tratamiento 
es [ A ] / 4.r. La prueba de hipótesis de los efectos se puede realizar por dos 
vías equivalentes en este caso: mds y F en el análisis de varianza. Si se utiliza mds 
se debe conocer el error estándar de un efecto factorial. 


Definición: SeaL = C|X, + C 2 X 2 +...+ C k X k una comparación. El 

estándar de Les (<x/ y el error estándar estimado será 


error 


(s/donde n es el número de observaciones de cada media X,. 
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Para el efecto principal promedio de A se tiene que: 

A = |I(ab) + I(a)-I(b)-|(T) 


( 8 . 11 ) 


donde (ab), a,son los promedios de rendimientos sobre r repeticiones. El 
error estándar estimado de A será: 


( s/ ^]¡4 + 4 + 4 + 4 ) = s/Vr cuando n = 


( 8 . 12 ) 


Unamatriz general ortogonal, (incluyendo la media) puede ser representada como: 


M ' 


+1 +1 +1 +1 

0) 

[A] 


-1 +1 -1 +1 

(a) 

[B] 


-1 -1 +1 +1 

(b) 

[AB]. 


+1 -1 -1 +1 

(ab) 


donde [/r] es la media de tratamientos. 

Al = efecto factorial total de A 
B j = efecto factorial total de B 
ABj = efecto factorial total de AB 

Caso de tres factores a dos niveles. 

En el estudio de tres factores, digamos A, B y C cada uno a dos niveles; 
(a o ;a 1 );(b o ;b 1 ),(c o ;c I ) respectivamente, el factorial seria un 2 3 y un total de 
ocho combinaciones posibles de tratamientos. Las combinaciones resultantes se 
pueden denotar por las dos formas siguientes: 


Tratamiento 

I 

II 

1 

( a ob 0 c o ) 

(1) 

2 

( a i b 0 c 0 ) 

a 

3 

( a o b o C o) 

b 

4 

(a, b,c 0 ) 

ab 

5 

( a oV,) 

c 

6 

( a ,b 0 c,) 

ac 

7 

( a o b iC)) 

be 

8 

( a ,b,c,) 

abe 
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Se utilizarán ambas notaciones de acuerdo a la conveniencia. Los efectos 
simples de A se determinan para cada una de las cuatro combinaciones de los 
otros factores. 

Efecto simple de A a niveles b 0 C 0 fijos = (a 1 b 0 C Q —a 0 b 0 C 0 ) 

Efecto simple de A a niveles bjC 0 fijos = (a,b,c o -a o b¡c o ) (8.13) 
Efecto simple de A a niveles b 0 c, fijos = (a,b 0 c l — a 0 b 0 c,) 

Efecto simple de A a niveles b 1 c 1 fijos = (a^^, — a o b¡c¡) 

El efecto principal de A será el promedio de estos 4 efectos simples: 

A - W [(a,b 0 c 0 -a 0 b 0 c 0 )+ (a 1 b 1 c 0 -a 0 b,c 0 ) + (a,b 0 c 1 -a 0 b 0 c 1 ) 
+ (a 1 b,c,-a 0 b 1 c 1 )] (8.14) 

esto es, el efecto principal de A es el efecto de A promediado sobre los niveles de 
los otros factores. A se puede escribir también como : 

A = ^-( a 1 -a 0 )(b 1 + b 0 Xc 1 +c 0 ) (8.15) 

La interacción AB se puede medir separadamente para cada nivel de C, así: 

Interacción AB al nivel Co 

= K[( a i b > c 0 _a obi c o)-( a ib 0 Co-a 0 boC 0 )] (S16) 

Interacción AB al nivel C 

i 

= [( a i b i c i“ a o b i c i) ” ( a i b o c i _a o^o c i)] ( 8 . 17 ) 

El promedio de estos dos efectos se toma como una estimación de AB, así: 

AB=i4{[( a 1 b l c 0 -a 0 b,c 0 )-(a 1 b 0 c 0 -a 0 b 0 cj] + [(a,b 1 c 0 -a 0 b 1 cJ-(a,b 0 c 0 -a 0 b 0 c 0 )]} 

(8.18) 

o también; 

AB = ^( a |- a °X bi - b o)( c . + Co ) (8-19) 
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Las dos interacciones pueden ser diferentes, lo que indicaría un cambio 
debido a los niveles de C; la diferencia entre estos dos efectos mediría la interacción 
ABC, así: 

ABC = X[a 1 bic l -a 0 b 1 c,-a 1 b 0 c 1 + a 0 b, ) c l -a 1 b 1 c 0 +a 0 b,c 0 + a 1 b 0 c 0 -a 0 b 0 c 0 ] 

( 8 . 20 ) 

o también: 

ABC = ^[ ( a i -a 0 )(b 1 -b 0 )(c 1 -c o ) ] (8.21) 

Si se usa la notación II, los efectos calculados se indican como sigue: 


A = ^[ ( a ,-l)(b, + l)(c 1 + l) ] = [(abe) - (be) + (ab) - (b) + (ac) — (c) + (a) - (1 

( 8 . 22 ) 

AB = “[ (a, — l)(b, — l)(c, +1) ] = [(abe) - (be) + (ab) - (b) - (ac) + (c) - (a) + (1 

(8.23) 

ABC = (a, — 1 )(b, — l)(c,-l) ] = [(abe) - (be) - (ab) + (b) - (ac) + (c) + (a) - (1 

( 8 - 24 ) 

para los efectos que no aparecen en la explicación las expresiones serían: 


B = |[ ( a , + l)(b,- l)( C j +1) ] 

C = ~[ (a, + l)(bj+ l)(c! 1) ] 

AC = |[ (a, - l)(bj + l)(Cj- 1) ] 
BC = |[ (a,+ l)(b,- l)(c, — 1) ] 


(8.25) 

(8.26) 

(8.27) 

(8.28) 


estos siete efectos son comparaciones mutuamente ortogonales. Una matriz de 
transformación ortogonal, incluyendo la media, sería: 
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M 


"+1 

+ 1 

+ 1 

+ 1 

+ 1 

+ 1 

+ 1 

+ f 


'( 1 ) 

[A] 


-1 

+ 1 

-1 

-I 

+ 1 

+ 1 

-1 

+ 1 


(a) 

[B] 


-1 

-1 

+ 1 

-1 

+ 1 

-1 * 

+ 1 

+ 1 


(b) 

[ c ] 


-1 

-1 

-1 

+ 1 

-1 

+ 1 

+ 1 

+ 1 


( c ) 

[AB] 


+ 1 

-I 

-1 

+ 1 

+ 1 

-1 

-1 

+ 1 


(ab) 

[AC] 


+ 1 

-1 

+ 1 

-1 

-1 

+ 1 

-1 

+ 1 


(ac) 

[BC] 


+ 1 

+ 1 

-1 

-1 

-1 

-1 

+ 1 

+ 1 


(be) 

[ABC] 


-1 

+ 1 

+ 1 

+ 1 

- 1 

-1 

-1 

+ 1 


(abe) 


fu = indica el efecto de la media general. 

A = indica el efecto factorial total de A y así sucesivamente. 


Si el experimento se repite r veces, entonces el divisor para un efecto medio será: 


2 k_l r = 4r 


para k = 3 


(8.29) 


La contribución de cada efecto a la suma de cuadrados de tratamiento 
vendrá dado por: "V rp t 'ri 

^ ' k) (8.30) 


2 k r 


donde los T. vienen dados por los símbolos (1), (a), (b),... 


Caso General de varios factores a dos niveles. 


Con k factores, tales como A, B, C, D, E,... los efectos principales se pueden 
representar en forma general por 

X = lycr(a± l)(b± l)(c± l)(d± l)(e± 1)... (8.31) 

donde X representa un efecto o interacción particular, el signo en cada paréntesis 
será positivo si la letra no aparece en X y negativo si la letra aparece en X. La 
notación de la combinación de tratamientos será como la forma II vista 
anteriormente. 
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1 


A - 2 k-i (a— l)(b+ l)(c+ l)(d+ l)(e+1)... 

(8.32) 

B - 2 k-i (a- l)(b- l)(c+ l)(d+ l)(e+1)... 

(8.33) 

AB - 2 k-i (a- l)(b- l)(c+ l)(d+ l)(e+1)... 

(8.34) 

ABCD - ^rr(a- l)(b- l)(c- l)(d- l)(e+1)... 

(8.35) 


Para escribir usando todas las combinaciones posibles usando la forma de 
notación II se procede de la siguiente forma: 


(1) 

d 

e 

de 

f 

a 

ad 

ae 

ade 

af 

b 

bd 

be 

bde 

bf 

ab 

abd 

abe 

abde 


c 

cd 

ce 

ede 


ac 

acd 

ace 

aede 


be 

bed 

bce 

bede 


abe 

abed 


abce 

abede 


Para calcular el numero de efectos principales e interacciones, se procede de 
la forma siguiente: 


Número 


Efectos Principales 
Interacción de dos factores 
Interacción de tres factores 
Interacción de cuatro factores 

Interacción de k factores 
Total 


A 


v3 

f k 1 
v4 J 

fk) 

^k y 


k(k-1) 


k(k- l)(k— 2) 


k(k- l)(k- 2)(k- 3) 


= 1 
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La contribución de cualquier efecto a la suma de cuadrados de tratamiento 
vendrá dado por : 

[X] 2 / 2 k “‘ r (8.36) 

donde [x ] 2 representa el efecto total. La varianza de cualquier efecto medio 
será igual a: 

V(X) =~- (8-37) 

donde X es el efecto medio. 

Ventajas de los Factoriales 

Las ventajas de la experimentación factorial dependerá de la finalidad del 
experimento. Un propósito de investigación sería el determinar si cada factor 
ejerce alguna acción sobre la variable respuesta; es decir, el objeto es tener un 
cuadro amplio de los efectos de los factores en lugar de determinar por ejemplo 
la combinación de niveles de los factores que dan la respuesta máxima. Como se 
vio al comienzo, se podría emplear para este propósito el procedimiento de 
factor único o el procedimiento factorial. 

Si se usa el procedimiento experimental del factorial se puede obtener 
información del efecto de los factores. Si son independientes o existe interacción 
entre ellos, cosa que no se obtendría mediante el procedimiento de factor único. 
Además si los factores son independientes en sus efectos, el procedimiento factorial 
significará un ahorro considerable de tiempo y material dedicado a los 
experimentos. El ahorro se deriva de dos hechos: 

cuando los factores son independientes todos los efectos simples de un 
factor son iguales a su efecto principal de manera que los efectos principales son 
las únicas cantidades necesarias para interpretar completamente los efectos de los 
factores. 

-. en un experimento factorial, cada efecto principal se estima con la misma 
precisión como si todo el experimento se hubiese dedicado a ese solo factor; la 
varianza de un efecto viene dada por: 


r2 k - 2 
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Por ejemplo, en un factorial 2 2 con dos repeticiones, la varianza para el 
efecto de A es igual a q- 2 ¡ 2 7 el número de unidades experimentales en el 
experimento sería igual a 8. Si se fuese a medir el efecto de A en un experimento 
de factor único se hubiese necesitado de las mismas 8 unidades experimentales en 
el experimento (4 repeticiones y 2 tratamientos), para alcanzar el mismo grado de 
precisión de ¿r 2 / 2 , mas aún, de acuerdo al número de factores que se investigue, 
los experimentos de factor único requerirán el doble, el triple, cuádruple,k 
veces el material esperimental que requiere un experimento factorial para alcanzar 
la misma precisión. 

Fisher resume las ventajas de los experimentos factoriales así: l)mayor 
eficiencia 2) mayor alcance en dos sentidos; 3) permite estimar por separado los 
efectos de cada factor y sus interacciones, 4) las conclusiones obtenidas de los 
experimentos factoriales tienen una mayor base inductiva. 

Existen también ciertas desventajas en el uso de los factoriales, ellas son: 

El factorial se hace impráctico a medida que el número de factores o de 
niveles se incrementa debido a limitaciones de material experimental o de recursos. 

Cuando aumenta el número de combinaciones de tratamiento la magnitud 
del error experimental también se incrementa, debiéndose recurrir a diseños menos 
simples para compensar en parte este aumento. 

También un aumento en el número de factores introduce dificultades en la 
interpretación de interacciones de alto orden. 

Sin embargo, la utilidad del procedimiento factorial es de innegable importancia 
y puede ser aplicado a muy variadas situaciones. En general se pueden citar: 

-. En trabajos de exploración, en los que el objeto es determinar rápidamente 
los efectos de cada uno de cierto número de factores dentro de un intervalo 
específico. 

-. En la comprobación de interacciones. 

-. Cuando se quiere encontrar la combinación de los niveles que maximiza 
la respuesta o en la estimación de la superficie de respuesta general. 
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En experimentos diseñados para poder llegar a recomendaciones que 
deben aplicarse a una gran variedad decondiciones. En estos experimentos 
se introducen factores adicionales o auxiliares para examinar los factores 
principales bajo una variedad de condiciones similares a las encontradas 
en la población a la cual se va a aplicar dichas recomendaciones. 

Factores a tres niveles 

En las nociones básicas en relación con factores con dos (2) niveles, se vio 
el análisis factorial en términos de efectos principales e interacciones. La simplicidad 
de este análisis surge por el hecho mismo de que cada factor ocurre a dos ( 2 ) 
niveles, y el efecto de cualquiera de los factores no sería mas que la diferencia 
entre el rendimiento promedio del factor a su más alto nivel y el rendimiento 
promedio del factor a su mas bajo nivel. Cada factor a más de dos niveles da 
lugar a diferentes enfoques de análisis de acuerdo con el objetivo de la investigación. 
Si en un experimento factorial entran uno o más factores cuantitativos, un análisis 
interesante y conveniente es el de estudiar la forma de la curva de respuesta; es 
decir, si el factor representa cantidades crecientes X de alguna sustancia, es de 
interés, por ejemplo, examinar si la respuesta Y a los crecientes niveles X del 
factor, es de naturaleza lineal, cuadrática, etc. 

Considere, a manera de ejemplo, un factor a tres (3) niveles. Sea A el factor 
y los tres (3) niveles indicados mediante a o , a,, a 2 con intervalos iguales; es decir, 
que a, va a tener una unidad adicional a la establecida para a o y a, tendrá dos 
unidades adicionales a la establecida para a 0 . Para el uso del análisis que sigue es 
importante que los niveles sean equiespaciados. 

Llevemos sobre un gráfico los rendimientos observados, indicados por 
a 0 , a,, a 2 contra los niveles del factor. 
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Niveles del factor 

Figura 8.2. Rendimientos observados contra los niveles del factor 

Se observa de la figura que hay dos respuestas a una cantidad unitaria del factor: 

Incremento deOal= a, — a o 
Incremento dela2 = a 2 —a, 

Suma de Incrementos = (a 2 -a,) + (a,-a 0 ) = a 2 -a o 
Diferencia de incrementos = (a 2 -a,)-(a,-a o ) = a 2 -2a, + a o 

Si el incremento producido por la primera unidad fuese igual al incremento 
producido por la unidad adicional entonces la suma de los incrementos mide el 
efecto lineal del factor. Si el incremento producido por una unidad adicional del 
factor es diferente al producido por la primera unidad del factor, entonces la diferencia 
de incrementos a 2 -2a, + a o mide la desviación respecto a la linealidad. De manera 
que las dos cantidades anteriores indican las características de la curva de respuesta. 

Definiendo: 

-. Efecto Lineal del factor A: 

A 1 =a 2 -a 0 (8.38) 

-. Efecto Cuadrático del factor A 

A 2 =a 2 -2a[ + a 0 (8.39) 

Como se ve, el efecto principal del factor A está asociado a dos grados de 
libertad, lo que indica que es posible realizar dos comparaciones mutuamente 
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ortogonales; los dos componentes efecto lineal y efecto cuadrático son 
precisamente dos contrastes mutuamente ortogonales del efecto de A. Estos 
efectos que miden la forma de la curva de respuesta, se conocen como 
comparaciones ortogonales en regresión. Dependiendo del número de niveles 
se puede examinar el efecto lineal, cuadrático, cúbico, cuartico de algún factor. 
Los coeficientes para una comparación ortogonal se derivan del método de 
polinomios ortogonales. 

Dos factores a tres niveles 

Sean dos factores A y B cada uno a tres niveles: (a 0 ,a,,a 2 )y(b 0 ,b,,b 2 ), 
respectivamente. 

Habrá nueve combinaciones de tratamientos asociados a ocho (8) grados 
de libertad en el análisis de varianza. Un primer esquema del análisis factorial 
estaría dado por los efectos principales y la interacción AB. 

EFECTO G. DE L. 

A 2 

B 2 

AB 4 

Es decir, las diferencias entre los rendimientos de las nueve (9) combinaciones 
pueden ser expresadas en tres componentes principales de efectos independientes: 
Efecto principal de A con dos (2) grados de libertad 
Efecto principal de B con dos (2) grados de libertad 
La Interacción AB con cuatro (4) grados de libertad. 

El efecto principal de A y el efecto principal de B comprenden cada uno 
dos (2) comparaciones independientes y la interacción AB comprende cuatro (4) 
comparaciones independientes. Esas ocho comparaciones se pueden realizar 
con bastante ventaja como comparaciones ortogonales de acuerdo al siguiente 
esquema: 
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Efecto 

G. de Libertad 


A 


2 

Efecto lineal 

A 1 

1 


Efecto cuadrático 

A 2 

1 



B 


2 

Efecto lineal 

B' 

1 


Efecto cuadrático 

B 2 

1 



AB 


4 

Efecto linealxlineal 

A'B 1 

1 


Efecto linealxcuadrático 

A ! B 2 

1 


Efecto cuadráticoxlineal 

A 2 B’ 

1 


Efecto cuadráticoxcuadrático 

A 2 B 2 

1 



Total 8 


Expresiones simbólicas para cada una de las comparaciones ortogonales en regresión: 


A ' =( a 2- a o)( b 0 + b l+ b 2) 

A 2 =(a 2 -2a 1 + a 0 )(b 0 + b, + b 2 ) 

B 1 =(b 2 -b 0 )(a 0 + a 1 + a 2 ) 

B 2 = (b 2 -2b, + b 0 )(a 0 + a 1 + a 2 ) 

A'B 1 = (a 2 -a 0 )(b 2 -b 0 ) 

A , B 2 ^(a 2 -a 0 )(b 2 -2a 1 + b 0 ) 

A 2 B 1 =(a 2 -2a 1 + a 0 )(b 2 -b 0 ) 

A 2 B 2 =(a 2 -2a, + a 0 )(b 2 -2a 1 + b 0 ) 

Interpretación de los efectos e interacciones de dos factores a tres (3) 
niveles en función de la naturaleza de la curva de respuesta 

Supóngase una tabla 3x3 en la que aparece los nueve (9) totales de 
rendimiento de las combinaciones de tratamientos de los factores A y B a tres (3) 
niveles cada uno. 
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Factor B 



V 

_ b L 

b 2 

Total 


p 

o 

o 

£ 

( a o b l) 

( a „ b 2 ) 

w 

Factor A 

a i ( a i K) 

( a l b.) 

( a i b 2 ) 

[a,] 


*2 ( a 2 b „) 

( a , b,) 

( a , b ,) 

[a 2 ] 

Total 

[bj 

[bj] 

[bj 



cada símbolo (a o bj), (a o b^,... dentro de la tabla equivale al total de rendimiento 
para la combinación indicada por los subíndices. Los totales marginales para los 
niveles de A se indican como a 0 , a,, a 2 ; e igualmente para los totales marginales 
de B. El componente A 1 (efecto lineal de A) puede estimarse separadamente a 
cada nivel de B. Cada uno de estos componentes los llamaremos efectos lineales 
simples de A; así: 


A x (0) = (a 2 — a o )b o efecto lineal de A al nivel 0 de B 
A'(l) = (a 2 — a o )bj efecto lineal de A al nivel 1 de B 
A l (2) = (a 2 — a 0 )b, efecto lineal de A al nivel 2 de B 

El efecto lineal total A 1 es la suma de los lineales simples. 

A 1 = (a 2 -a 0 )(b 0 + bj + b 2 ) ó([a 2 ]-[a o ]) (8.40) 

De la misma manera el componente A 2 (efecto cuadrático de A) puede 
estimarse separadamente para cada nivel de B. Se puede medir tres componentes 
cuadráticos simples, a saber: 

A 2 (0) =[(a 2 -a,)b o - (a,— a o )b o ]_ efecto cuadrático de A al nivel 0 deB. 
A 2 (l) =[(a 2 -ajb, - (a, —a o )bj] = efecto cuadrático de A al nivel 1 deB. 
A 2 (2) =[(a, —a,)b,- (a a 0 )b,]_ efecto cuadrático de A al nivel 2 deB. 
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El efecto cuadrático total A 2 será la suma de los tres efectos simples: 

A 2 = [(a 2 — a,)- (a,- a o )](b + b,+ b 2 ) = ([a 2 ]-[a,])- (faj-[a o ]) = [a 2 ]-2[a 2 ] + [aj 

(8 ' 41) 

Alternativamente para B sus efectos lineales simples serían: 

B‘(0) = (b 2 -b o )a o 
B‘(l) = (b 2 -b 0 )a 1 
B'( 2 ) = (b 2 -b 0 )a 2 

Efecto lineal total 

B '= ( b 2- b o)( a o+ a i + a 2 ) ó([b 2 ]-[bj) (8.42) 

Los efectos cuadráticos de B serían: 

B 2 (0) =[(a 2 — a,)b o - (a,-a 0 )b o ] 

B 2 (1) =[(a 2 -a,)b 1 - (a,-a o )b 1 ] 

B 2 (2) = [(a 2 -ajb,- (a,-a 0 )b 2 ] 

El efecto cuadrático total: 

B 2 =[(b 2 -b,)- (b, b 0 )](a o + a 1+ a 2 ) = ([b 2 ]-[b,]) - ([bj - [bj =[bj-2[b 1 ] + [bj 

(8.43) 

Como se ve la interacción AB con 4 grados de libertad puede ser subdividida 
en los siguientes componentes ortogonales: 

A'B 1 = (a 2 -a 0 )(b 2 -b 0 ) = (a 2 -a 0 )b 2 - (a, -a 0 )b 0 = A 1 (2) - A 1 (0) 
o también 

A'B' = (b 2 - b 0 )(a 2 - a 0 ) = (b 2 - b 0 )a 2 -(b 2 - b 0 )a 0 = B*(2) - B l (0) (8.44) 
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en forma similar, 

A*B 2 = (a 2 - a 0 )[(b 2 - b,) -(b, - b 0 )] 

AB = (a 2 -a 0 )b 2 -2(a 2 —a 0 )bj +(a 2 —a 0 )b 0 

A'B 2 = A l (2)-2A'(1) + A‘(0) 
o también 

A'B 2 =[(b 2 -bj-íb, -b 0 )]a 2 -[(b 2 -b.Mbj -b 0 )]a 0 
A'B 2 = B 2 (2) - B 2 (0) 
de igual forma; 

A B — [[(a 2 — 3]) — (aj — a 0 )]b 2 — [(a 2 — a,) — (a¡ — a 0 )jb 0 | 

~ A 2 (2) - A 2 (0) 
o también 

A B — (b 2 — b 0 )a 2 — 2(b 2 — b 0 )aj + (b 2 — b 0 )a 0 
= B‘(2) -2B'(1) + B‘(0) 

A 2 B 2 = [[(a 2 - ajHar^bj-Kaj-ajHaj-aoJlbi] (8.48) 

■[[( a 2 " a 1 )-( a r a o)]br[(a 2 -a 1 )-(a 1 -a 0 )]b 0 ] 

= A 2 (2)-A 2 (1)-[A 2 (1)-A 2 (0)] 

= A 2 (2)-2 A 2 ( 1 )+A 2 (0) 

Si se supone que la forma de la curva de A es lineal y si los niveles de B no 
afectan su pendiente, entonces los efectos lineales simples tendrán igual pendiente 
(ver Figura 8.3), bajo estas condiciones una recta de pendiente promedio sobre 
los niveles de B sería de mejor estimación y se basaría en los totales marginales 
expresados en la ecuación (8.40). 

Si se supone ahora que la forma de la curva de A sigue siendo lineal pero 
que la pendiente está afectada por los niveles de B, la medida de este efecto estará 
dada por dos componentes de interacción independientes: el componente A'B 1 
y el componente A 1 B 2 (véase Figura 8.3.2.a y 8.3.2.b) En 8.3.2.a la interpretación 


(8.45) 


(8.46) 


(8.47) 
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es la misma de la interacción AB de un factorial 2 2 ; es decir, se mide la diferencia 
del efecto de A a los niveles b o y b 2 de B. Note que de acuerdo a (8.44), sería una 
comparación entre A 1 (2) versus A 1 (0). Esto indica que es una comparación entre 
las pendientes de las rectas de regresión de Y sobre A estimadas para los niveles 
b o y b 2 de B. En 8.3.2.b interviene además la recta de regresión estimada al nivel 
bj de B. La comparación A 1 B 2 equivale a la ecuación (8.45), esto es, 

A 1 (2)-2A 1 (1) + A'(0) 

lo que indica que es la comparación del promedio de las pendientes de las rectas 
de regresión de A a los niveles 2 y 0 de B contra la pendiente de la recta de A al 
nivel bj de B. 

Si la forma de la curva de A es cuadrática y si los niveles de B no afectan su 
pendiente en ningún punto de su recorrido, entonces los efectos simples cuadráticos 
serían iguales y las curvas tendrían igual pendiente en cualquier punto de su 
recorrido (vea Figura 8.3.3), bajo estas condiciones el componente cuadrático 
promedio sería el de mejor estimación y se basaría en los totales marginales 
expresados en la ecuación (8.41). 

En el caso de que exista interacción con los niveles de B entonces existen 
dos componentes independientes de la interacción A 2 B: A 2 By A 2 B 2 . (Ver Figuras 
8.3.4.ay 8.3.4.b) En Figura 8.3.4.a se observa que la forma cuadrática de la curva 
está afectada por los niveles de B. Este componente solo mide los cambios de 
forma de la curva a los niveles b 2 y b o de B. Es de notar que la ecuación (8.47) 
lo expresa como la comparación entre el componente cuadrático A 2 (2) al nivel b 2 
de B con el componente cuadrático A 2 (0) al nivel b o de B. En la figura 8.3.4.b se 
observa que en la comparación A 2 B 2 entra la curva determinada al nivel b ( de B. 

A 2 B 2 = A 2 (2) + A 2 (0) - 2 A 2 (l) 

que indica la comparación entre el promedio de los componentes cuadráticos a 
los niveles 2 y 0 de B contra el componente cuadrático A 2 (l) determinado al nivel 
1 de B. 
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Figura 8.3.1 
Efecto lineal de A 
a cada nivel de B 



a, a, a 2 
No hay interacción 


Figura 8.3.2 
La interacción A'B 




Figura 8.3.3 
Efectos cuadráticos 
a cada nivel de B 


Figura 8.3.4 
La interacción A 2 B 




a, a, a 2 



8.3.4a. Componente A 2 B' 


8.3.4bComponente A 2 B 2 


Figura 8.3 Gráficos de interacción 
Contribución a la Suma de Cuadrados 


Cada uno de los componentes antes descritos son mutuamente ortogonales 
asociados cada uno con un grado de libertad. Hay ocho componentes ortogonales 
y cada uno contribuye independientemente a la suma de cuadrados de tratamiento. 
Por ejemplo, la contribución de X a la suma de cuadrados de tratamiento es: 


SC(X) = 


[x ] 2 

nlcf 


(8.49) 


donde 

[X] = el efecto total 

n = número de observaciones de los totales que entran en la comparación 
^ Cf = suma de cuadrados de los coeficientes que entran en esa comparación. 

Por ejemplo, los coeficientes para el efecto lineal y cuadrático de un factor a 
tres (3) niveles son: 
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Niveles 

Coeficientes bneales 

Coeficientes cuadráticos 

0 

-1 

1 

1 

0 

-2 

2 

1 

1 


Considérense ahora algunos métodos para calcular [x]: 

Método 1 

Se calcula directamente utilizando las expresiones algebraicas para los efectos, así: 

A 1 = a 2 -a 0 
A 2 = a 2 -2a, + a 0 

donde a 0 , a,, a 2 son totales marginales en la tabla 3x3. 

A'B 1 = (a 2 - a 0 )(b 2 - b 0 ) = (a 2 b 2 -a 2 b 0 -a 0 b 2 + a o b o ) 

donde (a 2 b 2 ),(a 2 b 0 ),...,son totales de la combinación de tratamientos y que 
entran en el cuerpo de la tabla. 

Método 2 

Se forma una tabla 3x3 con los totales de tratamientos en el cuerpo de la 
tabla y los totales marginales de A y de B. 


Factor B 



b, 

b* 

Total 

Lineal 

A 1 

Cuadrático 

A 2 

a 

o 

( a A) KM 

K bj) 

w 

-1 

-w 

1 

W 

Factor A a, 

( a A) ( a A) 

( a ! b 2 ) 

[a,] 

0 

0- 

-2 

-2[ aj 

a . 

( a , K) (a, b,) 

( a 2 b 2 ) 

W 

1 

[a ? ] 

1 

W 

Total 

Al bj 

[b 2 ] 






Lineal 

-1 0 

1 






B 1 

A 

l—l 

O 

[b ? ] 






Cuadrático 

1 -2 

1 






B’ 

[bj -2[b,] 

Al 







Los componentes lineal y cuadrático de los efectos principales A y B se 
calculan de los respectivos totales marginales. Para calcular los cuatro componentes 
de la interacción AB, se procede a formar las matrices 3x3 cuyos elementos son 
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los coeficientes que multiplicaran a los totales de tratamientos que ocupan la 
misma posición en la tabla 3x3. Para hallar las respectivas matrices se procede 
como sigue: 

Componente Producto de Matrices Matriz de Coeficientes 


A'B 1 


1 


" 1 0-1 

0 

x[-l 0 1] = 

0 0 0 

1 


-1 0 1 


A’B 2 


- r 


-1 

2 

-f 

0 

x[l -2 l] = 

0 

0 

0 

1 


1 

-2 

1 


1 ’ 


"-1 

0 

-l" 

-2 

x [-10 1 ] = 

2 

0 

-2 

1 


-1 

0 

1 



1 


1 

-2 

1 

A 2 B 2 

-2 

1 

x[l -2 1 ] = 

-2 

1 

4 

-2 

-2 

1 


Si se quiere calcular, por ejemplo, A'B 1 ; la matriz A'B' dice que todos los 
productos serán nulos menos los de los extremos, así: 


A‘B‘- (a o b o ) l + (a o b 2 )(— l)+(a 2 b 0 )(—l)+(a 2 b 2 )(l) - (a 2 b 2 a 2 b 0 a 0 b 2 + a o b o ) 


que coincide con el obtenido anteriormente. Además: 


SCÍA'B 1 ) = 


A'B 1 


nV C“ 

..v* - . ' > 


í 


(8.50) 


donde n = r ya que cada total esla suma dfe ^repeticiones. 
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XC? = l 2 +(-l) 2 +(-l) 2 +l 2 =4 

, [ A '] 2 

SC(A) =iiV 


(8.51) 


donde n = sxr ya que cada total a ¡ ] es la suma de s niveles de B y de r repeticiones. 


Método 3 

El otro método es formar una matriz completa, escribiendo en una columna 
las combinaciones de tratamientos y luego en las columnas siguientes los coeficientes 
de las respectivas comparaciones. 


Totolde 

Tratamientos A' 

A 2 

Componentes 
B‘ B 2 

en regresión 

A l B l A l B 2 

A 2 B‘ 

A 2 B 2 

Va A -1 

1 

-1 

1 

i 

-1 

-1 

1 

T-a.b, -1 

1 

0 

-2 

0 

2 

0 

-2 

T =a b 2 -1 

02 

1 

1 

1 

-1 

-1 

1 

1 

o 

II 

_p 

o 

O 

-2 

-1 

1 

0 

0 

2 

-2 

~ II 
^cr 

o 

-2 

0 

-2 

0 

0 

0 

4 

T =a,b, 0 

12 

-2 

1 

1 

0 

0 

-2 

-2 

T =a 2 b 1 

20 

1 

-1 

1 

-1 

1 

-1 

1 

T -a 2 b, 1 

21 

1 

0 

-2 

0 

-2 

0 

-2 

T = a 2 b 2 1 

22 

1 

1 

1 

1 

1 

1 

1 
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Otra forma de escribir la matriz es la siguiente: 


IM 1 

[ A *] 


-1 -1 -1 0 0 0 1 1 f 

1 1 1 -2 -2 -2 1 11 

a o b o 

a o b l 

[B 1 ] 


-1 01 - 101-101 

a o b 2 

[b 2 ] 


1-2 11-21 1-21 

a i b o 

[a’b 1 ] 

— 

1 0 -1 0 0 0 -1 0 1 

a , b , 

a , b 2 

a,b 

[a'b 2 ] 


- 12-1000 1-21 

[a 2 b‘] 

[a 2 b 2 ] 


-1 0 1 2 0 - 2-101 

1-2 1-2 4-2 1-2 1 

2^o 

a 2 bj 

a 2 b 2 


Si los factores que intervienen en el factorial a tres o mas niveles son 
cuantitativos, el procedimiento descrito parece ser el que conduce a una 
interpretación concreta del experimento. Si interviene por ejemplo, un factor 
cuantitativo (A) y un factor cualitativo (B), un esquema de análisis sería: 

G. de L. 


Efecto lineal de A: A 1 1 

Efecto cuadrático de A: A 2 1 
Efecto total de B: B 2 

Interacción AB 4 


Si hay interacción el esquema sería: 

G. de L. 


Efecto total de B 2 

Efecto lineal de A a b de B 1 

O 

Efecto lineal de A a b t de B 1 

Efecto lineal de A a b, de B 1 


Efecto cuadrático de A a b de B 1 

O 

Efecto cuadrático de A a b t de B 1 
Efecto cuadrático de A a b 2 de B 1 
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EXPERIMENTOS FACTORIALES 2 k 

En el siguiente cuadro se presentan los resultados de un ensayo realizado en 
Fertilización N, P, K en maíz con un arreglo de tratamiento factorial 2 3 en un 
diseño de experimento completamente aleatorizado. 

TRATAMIENTOS 


(1) 

a 

b 

ab 

c 

ac 

be 

abe 

10 

16 

27 

23 

16 

16 

25 

28 

18 

19 

17 

18 

25 

16 

23 

24 

8 

16 

16 

28 

22 

19 

30 

20 

36 

51 

60 

69 

63 

51 

78 

72 
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Modelo Lineal Aditivo 

Y ijk¡ =ju+a ¡ + p ¡ +y k + {afJ)j + (ay) ¡k + (fly) jk + {aJ3y) i¡k + £ ¡jkl (8.43) 

Y¡¡ u = observación 1-esima del i-ésimo nivel del factor A, j-ésimo nivel 
del factor B y k-ésimo nivel del factor C. 

/J = media general 

a í = efecto del i-ésimo nivel del factor A 
= efecto del j-ésimo nivel del factor B 
(afí) j - efecto de la interacción de primer orden del i-ésimo nivel del 
factor A con el j-ésimo nivel del factor B 

( ay)¡ k = efecto de la interacción de primer orden del i-ésimo nivel del 

factor A con el k-ésimo nivel del factor C 

(fíy) jk = efecto de la interacción de primer orden del j-ésimo nivel del 
factor B con el k-ésimo nivel del factor C 

(afiy) ¡jk = efecto de la interacción de segundo orden del i-ésimo nivel 

del factor A j-ésimo nivel del factor B con el k-ésimo nivel del factor C 
£¡j k i = error experimental 


Supuestos del Modelo: 
Modelo I (fijo) 


I>, =0 

i=l 

j=i 

Zr.=o 

k=l 
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a b 


Z2>A, = 0 

i=l j=l 


Z Z = 0 

i=l k=l 

Z Z (#o*=o 

j=l k=l 


abe 


ZZZ ( a fir)ijk = 0 


£ ¡Jk ~ NID(0,a¡) 


Modelo II (Aleatorio) 


a r ~ NID(0,a 2 a ) 

~ NID ( 0 , a ¡) 
y k ~ NID (0, cr *) 
(a/3)ij~NID{ 0,a 2 a/¡ ) 
(ay) lk ~NID{ 0,o¿) 
{Pr) jk ~NID{D,al) 
( a fiy)¡ jk ~ NID ( 0 , a 2 aPr ) 
% ~ NID ( 0 , a () 
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Hipótesis: 

Modelo I 

Ho: a¡ = 0 

Ho: (aP)..= 0 

Ho: {apy) ijk 

Ha: a¡ * 0 

Ha: (ap) tJ * 0 

Ha: {aPy) ijk 

Ho: Pj= 0 

Ho: (ay) ik = 0 


Ha: * 0 

Ha: (ay) tk * 0 


Ho: y k = 0 

Ho: (py) jk = o 


Ha: y k * 0 

Ha: {Py) jk * 0 


Modelo II 

Ho: al =0 

Ho: a ap = 0 

Ho: al Pr = 0 

Ha: a 2 a * 0 

Ha: a ap * 0 

Ha: a a p r * 0 

Ho: cPp- 0 

Ho: al 7 = 0 


Ha: a 2 p* 0 

Ha: a 2 ap * 0 


Ho: a 2 r = 0 

Ho: a 2 p r = 0 


Ha: a] * 0 

Ha: a 2 p y * 0 



El esquema de Anavar está dado en la Tabla 8.2 dada a continuación: 
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b ■'< a 

s £ 


t + 


5i«í + 


s- b 


b 

-c 


b~ 




O 

c3 

CU 


s 

’C 

a> 

cu 

x 

W 


ctf 

CU 

ctf 


ál"W: 

V € V- 

1 J5 

c + 

3 

«. b 




“Wí 

b- 

JC¡ 

CO 

+ 

V 


I 


$ 


■w 


& 

vH: 

I "ÍXI.I 

JD 

+ 

V 


m 


“W2 ”WI 
=^1, ‘Wí 
■W-i 


+ 
<N w 

b 


c 

< 

<D 

-a 

c3 


g 

cr 

C/5 

w 

r4 

06 

03 

3 

C3 


O 

tu 

I 


CJ 

LU 

I 

x> 


"W¿ *Wí -0\|i 


cc 

CJ 

OO 

I 

< 

CJ 

00 

I 

ü 

uJ 

I 


‘W¡ 

■Wj 


u 

CJ 

00 

I 

< 

CJ 

00 

I 

CJ 

tu 

I 

X) 


-Wi 

-Wi 


CJ 

CJ 

00 

I 

CQ 

a 


i 

ü 

ÜÚ 

i 


< 

CJ 

oo 

I 

Ü 

tu 

l 


U 

CQ 

y 

oo 
I 

O 
< 
U 

05 

I 

CQ 
< 
CJ 
00 

<N^ ^ I 

^ oT (J 

o U 

e “H2 7 

-p^I¿ u 
■Wi »WI 7 


u 

c£ 

i 


•Wi 

■Hi 

"W-I 
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Desarrollo del Ejemplo 
Sumas de Cuadrados 

Suma de Cuadrados de Tratamientos: 

36 2 +51 2 +...+78 2 +12 1 
SCTrat =-~ 

SCTrat = 10.032-9.600 = 432 


(480) 2 
24 


Sumade Cuadrados de los Efectos Principales. Cuadros de doble entrada 



b 

O 

b i 

Total 

a o 

99 

138 

237 

a i 

102 

141 

243 

Total 

201 

279 

480 


c 

O 

c i 

Total 

a o 

96 

141 

237 

a i 

120 

123 

243 

Total 

216 

264 

480 


c 

O 

c i 

Total 

b 

87 

114 

201 

Total 

Y» 


17 o - 

216 

264 

480 


Suma de Cuadrados de A 
237 2 + 243 2 480 2 


SCA = 


3x2x2 


24 


9601.5-9600 = 1.5 
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Suma de Cuadrados de B 

201 2 + 279 2 480 2 


3x2x2 24 


= 9853.5-9600 = 253.5 


Suma de Cuadrados de C 

216 2 + 264 2 480 2 

SCC = ————• - —— = 9696 - 9600 = 96 
3x2x2 24 


Suma de Cuadrados de las Interacciones 


Suma de Cuadrados AB 

99 2 +138 2 +102 2 +123 2 480 2 

SCAB = ------ - 1.5 - 253.5 = 9855 - 9600 - 1.5 - 253.5 = 0 

3x2 24 

Suma de Cuadrados A C 

96 2 +141 2 +120 2 +123 2 480 2 

SCAC = —---1.5 - 96 = 9771 - 9600 -1.5 - 96 = 73.5 

3x2 24 

Suma de Cuadrados BC 

87 2 +114 2 +129 2 + 150 2 480 2 

SCBC = ---- 253.5 - 96 = 9951 - 9600 - 2535 - 96 = 1.5 

3x2 24 

Suma de Cuadrados ABC 


SCABC = ■ 


36 2 +51 2 +...+78 2 +72 2 480 2 


-1.5 - 253.5 - 96 - O - 73.5 -1.5 = 6.0 


Suma de Cuadrados Total 


SCTotal= 10 2 + 18 2 + 8 2 +...+24 2 + 20 2 -F.C = 724.0 


Suma de Cuadrados del Error Experimental 


SCEE = SCTotal - SCTrat = 724 - 432 = 292 
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Cuadrados Medios o Varianzas 

Cuadrados Medios de Tratamiento 
SCTrat 432 

CMTrat =-— =-- = 61.71 

t -1 7 

Cuadrados Medios para Efectos Principales 


Cuadrado Medio para A 
SCA 1.5 

CMA =-= — = 1.5 

a-1 1 

Cuadrado Medio para B 
SCB 253.5 

CMB = - -= — = 253.5 


b -1 


1 


Cuadrado Medio para C 
SCC 96.0 

CMC =-=-= 96 

c-1 1 

Cuadrados Medios para Interacciones 

Cuadrado Medio para AB 
SCAB 


CMAB = 


= 0 


(a— l)(b— 1) 

Cuadrado Medio para A C 


CMAC = 


SCAC 


73.5 


(a- l)(c-1) 

Cuadrado Medio para BC 
SCBC 


1 


73.5 


CMBC = 


(b-D(c-l) 


= 1.5 
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Cuadrado Medio para ABC 

SCABC 


CMABC = 


= 6.0 


(a — l)(b— l)(c— 1) 

Cuadrado Medio para el Error Experimental 


CMEE = 


SCEE 


292 


(abc-l)(r-l) 16 


= 18.25 


Análisis de Varianza 


ANAVAR (MODELO FIJO) 


F.deV. 

G. deL. 

SC 

CM 

F 

F(5%) 

F(l%) 

Trat 

7 

432.0 

61.71 

3.38** 

2.66 

4.03 

A 

1 

1.5 

1.5 

0.08 N.S. 

4.49 

8.53 

B 

1 

253.5 

253.5 

13.89** 



C 

1 

96.0 

96.0 

5.26* 



AB 

1 

0.0 

0.0 

0.0N.S. 



AC 

1 

73.5 

73.5 

4.02N.S. 



BC 

1 

1.5 

1.5 

0.08N.S. 



ABC 

1 

6.0 

6.0 

0.33N.S. 



EE 

16 

292.0 

18.25 




Total 

23 

724.0 
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ANAVARÍMODELO ALEATORIO) 


F.deV. 

G. de L. 

CM 

F 

Trat 

7 

61.71 


A 

1 

1.50 


B 

1 

253.50 


C 

1 

96.00 


AB 

1 

0.00 

0.00 

AC 

1 

73.50 

12.25** 

BC 

1 

1.50 

0.25 

ABC 

1 

6.00 

0.32 

EE 

16 

18.25 


Total 

23 




Análisis de Varianza calculado a través de matrices ortogonales 
Contrastes ortogonalesy totales de tratamiento 



36 

51 

60 

69 


(1) 

a 

b 

c 


+1 

+1 

+1 

+1 

A 

- 1 

+1 

-1 

-1 

B 

-1 

-1 

+1 

-1 

C 

-1 

-1 

-1 

+1 

AB 

+ 1 

-1 

-1 

+1 

AC 

+ 1 

-1 

+1 

-1 

BC 

+ 1 

+1 

-1 

-1 

ABC 

-1 

+1 

+1 

+1 


63 

51 

78 

72 


ab 

ac 

be 

abe 


+1 

+1 

+1 

+1 

1 

+1 

+1 

-1 

+1 

a 

+1 

-1 

+1 

+1 

b 

-1 

+1 

+1 

+1 

c 

+1 

-1 

-1 

+1 

ab 

-1 

+1 

-1 

+1 

ac 

-1 

-1 

+1 

+1 

be 

-1 

-1 

-1 

+1 

abe 


Sumas de Cuadrados: La contribución de cada efecto a la suma de cuadrados 
de tratamiento viene dada por: 
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Suma de Cuadrados de efectosprinápales 

(-36 + 51-60-69 + 63 + 51-78-1- 72) 2 6 2 

SCA = -—-— = — = 1.5 

8x3 24 

(-36 -51 + 60-69 + 63-51 + 78 + 72) 2 72 2 

SCB = -—-— = — = 253.5 


8x3 


24 


(-36 - 51-60 + 69-63 + 51 + 78 + 72) 2 48 2 

SCC = --—-— = — = 96.0 

8x3 24 


SCAB 


Suma de Cuadrados de Interacciones 

(+36 - 51-60 + 69 + 63 — 51-78 + 72) 2 


8x3 


= 0.0 


(+36 - 51 + 60-69-63 + 51-78 + 72) 2 42 2 

SCAC = --- ~ -— = -rr- = 73.5 


SCBC : 


SCABC: 


8x3 24 

(+36 + 51-60-69-63-51 +78+ 72) 2 (-6) 2 

8x3 ~ 24 

(-36 + 51 + 60 + 69-63-51-78 + 72) 2 12 2 


= 1.5 


8x3 


24 


= 6.0 


Suma de Cuadrados de Tratamiento 


SCTrat = 1.5 + 253.5 + 96.0 + 0.0 + 73.5 + 1.5 + 6.0 = 432 

El resto del procedimiento es igual al que aparece en las páginas anteriores, 
incluyendo el Análisis de Varianza. 
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Interpretación 

Modelo Fijo 

Este es el modelo que se utiliza en la mayoría de los experimentos agrícolas 
cuando no se está repitiendo el experimento ni en el tiempo ni en el espacio. 

De acuerdo a los resultados del Análisis de Varianza en los que resultaron 
significativos los efectos de los factores B y C; es decir, Fósforo y Potasio, se 
puede concluir que el cultivo de maíz bajo estas condiciones de suelo y clima 
responde positivamente a la fertilización con Fósforo y Potasio. Como se trata 
de la aplicación o no del nutriente (ensayo exploratorio) con sólo observar cual 
de las dos medias es mayor, es suficiente para determinar el mejor tratamiento. 

Modelo Aleatorio 

Al observar los cuadrados medios esperados se nota que no existen 
denominadores apropiados para la prueba de significación de F para los factores 
independientes (N, P, K) por consiguiente se tendrían que realizar pruebas de F 
aproximadas. 

Para el caso de las interacciones de primer orden el denominador apropiado 
para la prueba de F es la interacción de segundo orden ABC y para esta interacción 
el denominador es el Error Experimental, al realizar las pruebas de F solamente 
la interacción AC es significativa; es decir, para este modelo existe significación 
para el efecto interactuante de Nitrógeno y Potasio. 

Puede apreciarse que la interpretación fue completamente diferente a la del 
Modelo Fijo. Sin embargo es de notar que se utilizó el modelo aleatorio 
solamente con fines didácticos, ya que para este tipo de experimentos no 
tiene ninguna justificación considerar aleatorios los factores bajo estudio. 
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EJERCICIOS 


Con un conjunto de datos afín a su área de investigación, responda las 
siguientes preguntas: 

- Establezca el modelo lineal aditivo describiendo cada uno de los 
términos del modelo y los subíndices presentes. 

- Dé los supuestos del modelo. 

- Establezca las hipótesis a probar. 

-Escriba el cuadro de ANAVAR de acuerdo al modelo. Considere 
cuadrados medios esperados y los estadísticos de prueba. 

-Realice el ANAVAR. 

- Pruebe las hipótesis. 

- Interprete los resultados. 
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EXPERIMENTOS FACTORIALES 3 K 

En el siguiente cuadro se presentan los resultados de un ensayo realizado en 
Fertilización N, P, K en maíz con un arreglo de tratamiento factorial 3 2 en un 
diseño experimental bloques al azar. 

TRATAMIENTOS 




a 2 



a , 



a 

o 



Bloques 

b 2 

b, 

b 

O 

b 2 

b , 

b 

o 

b 2 

b l 

b 

0 

Total 

I 

52 

28 

56 

66 

36 

20 

56 

42 

22 

378 

II 

48 

44 

48 

54 

24 

38 

34 

16 

36 

342 

III 

60 

48 

40 

56 

62 

32 

52 

36 

28 

414 

IV 

40 

48 

16 

48 

46 

22 

34 

26 

26 

306 

Total 

200 

168 

160 

224 

168 

112 

176 

120 

112 

1440 


Modelo LinealAditivo 

Y ¡Jkl =ju+ a t + A + ■{rxp) ¡¡ + y k + s ¡jkl (8.44) 

Y¡j k¡ — observación k-esima del i-ésimo nivel del factor A y j-ésimo nivel del factor B 
// = media general 

a'¡ = efecto del i-ésimo nivel del factor A 
Pj — efecto del j-ésimo nivel del factor B 
y k — efecto del k-ésimo bloque 
Sjy = error experimental 
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Modelo I (fijo) 
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Z <*i =0 

¡=1 

Z 4 = 0 

j=i 


ÍZ(«4 = 0 

¡=i j=i 

y k ~NID(0,cr 2 ) 
£ ¡jk ~MD(0,a 2 e ) 


Modelo II (Aleatorio) 

a t ~ 7VZD(0, cr 2 ) 
j3j~MD(0,a 2 ) 
( a P)i¡ ~ MD(0, cr 2 a¡¡ j 
y k ~ MD(0, a 2 ) 
e jk ~MD{0,al) 
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Hipótesis: 


Modelo I 

Ho: a t = 0 

Ho: (ap)¡j= 0 


Ha: a¡ 7 1 - 0 

Ha: (ú#)** 0 


Ho: P¡ = 0 

Ho: cr = 0 


Ha: Pj * 0 

Ha: P r * 0 


Modelo II 

Ho: P a - 0 

Ho: alp 

= 0 

Ha: al ± 0 

Ha: P a p 

*0 

Ho: P p = 0 

Ho: P y 

= 0 

Ha: Pp ^ 0 

Ha: P y 

*0 


El esquema del Análisis de Varianza y las Esperanzas de los Cuadrados 
Medios se muestran en las Tablas 8.3 y 8.4 respectivamente. 
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Tabla 8.3. Esquema de análisis de varianza para el Experimento Factorial 3 2 

F.deV. 

G. de L. 

Suma de Cuadrados 

CM 

Bloques 

r-1 

r Y 2 

Z “-F.C. 

k=i ab 

SCBloq/ (r-1) 

Tratamientos 

t-1 

a b Y 2 

ZZ ^-f.c. 

M j=l r 

SCTrat/(t-1) 

A 

a-1 

a v 2 

ZtT“ F.C. 
i=i br 

SCA/ (a-1) 

B 

b-i 

b Y 2 

Z—-F.C. 

i=i ar 

SCB/(b-1) 

AB 

(a-l)(b-l) 

a b y* 

— -F.C.-SCA-SCB 

i=l j=l t 

SCAB/(a-l)(bl) 

EE 

(ab-l)(r-l) 

SCT otal-SCT rat-SCBloq 

SCEE/(ab-l)(r-l) 

Total 

abr-1 

Üi YJ-F.C. 

i=l j=I k=l 

F.C.= (GranTotal) 2 /abr 
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Tabla 8.4. Esperanzas de los Cuadrados Medios para el Factorial 3 ; para el caso de los Modelos Tipo I, II, III 
E(CM) Modelo I Denomi E(CM) Modelo II Denomi 

___ nador _ nador 

o: + aber a] + ab al 
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Desarrollo del Ejemplo 


Suma de Cuadrados 

Suma de Cuadrados de Tratamientos: 

200 2 +168 2 +...+112 2 1440 2 

SCTrat =-:- 


242.688 

SCTrat - ~ — 57.600 = 3072 

4 

Suma de Cuadrados de los Efectos Principales. 
Cuadro de doble entrada 


36 


a 

Total 


b. 

b. 

b 

Total 

200 

168 

160 

528 

224 

168 

112 

504 

176 

120 

112 

408 

600 

456 

384 

1440 


Suma de Cuadrados de A 

528 2 +504 2 +408 2 1440 2 

SCA = — 


4x3 

Suma de Cuadrados de B 


36 


600 2 +456 2 +384 2 1440 2 


SCB = 4,3 36 

Suma de Cuadrados de la Interacción. 


672 


2.016 


Suma de Cuadrados deAxB 


200 2 + 168 2 +...+ 120 2 +112 2 
SCAB =--- 


- F. C.-SCA - SCB = 384 
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Suma de Cuadrados de Bloque 





378 : 

2 +342 2 +414 2 

+ 306 2 

1440 2 








ij LCsCj 



3x3 



" 36 =72 ° 

Suma de Cuadrados Total 










1440 2 


SCTotal = 52 2 

+ 28 2 

+...+26 - 

36 

= 6512 

Suma de Cuadrados del Error Experimental 


SCEE -: 

SCTotal - Sctrat - SCBloq 



SCEE = 

6512 -3072 - 720 = 

2720 



Cálculo de 

las sumas de cuadrados a través de los coeficientes 




ortogonales 


b 2 b, 

b 

0 





b 2 

a 2 


1 

0 

-1 

1 

-2 1 

a i 


1 

0 

-1 

1 

-2 1 

a 

o 


1 

0 

-1 

1 

-2 1 




AjBj 



A t B 2 

1 1 

1 

1 

0 

-1 

1 

-2 1 

0 0 

0 

0 

0 

0 

0 

0 0 

-i -i 

-1 

-1 

0 

1 

-1 

2 -1 

A, 



AA 



a,b 2 

1 1 

1 

1 

0 

-1 

1 

-2 1 

-2 -2 

-2 

-2 

0 

2 

-2 

4 -2 

1 1 

1 

1 

0 

-1 

1 

-2 1 
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SCA , = 


Suma de Cuadrados de A lineal 

( 528 - 408) 2 


120 2 


l 2 + l 2 + l 2 + (- 1) 2 + (- 1) 2 + (- 1 ) 2 ] x 4 6 x 4 


= 600 


sca 2 = 


Suma de Cuadrados de A cuadrátko 

(528 + 408 - 2x504) 2 


[l 2 +1 2 +1 2 +1 2 +1 2 +1 2 + (-2) 2 +(-2) 2 ] x4 


(936-1008) 2 

72 


= 72 


SCB , = 


Suma de Cuadrados de B lineal 

(600 -384) 2 


216 2 


[ l 2 + 1 2 + 1 2 + (- l ) 2 +(- l ) 2 +I 2 ]x4 24 


1.944 


SCB 


Suma de Cuadrados de B cuadrátko 
_[600 + 3 84 - 2x456] 2 


2 F i - . ií , 12 


1- + I' +V + (—2) + (-2) + (-2) 2 + (-2) 2 + l 2 + l 2 U 


(984-912) 2 

72 


= 72 


Suma de Cuadrados de la Interacción A lineal x B lineal 
[( 200 + 112 ) - (176 + 160)] 2 (- 24) 2 

2 + 1 2 +(- l ) 2 +(- 1 ) 2 ] x 4 " 16 


SCA.B, = r 

[i 


= 36 


Suma de Cuadrados de la Interacción A lineal xB cuadrátko 

[(200 + 160 + 240 ) -(176 + 112 + 336 )f ( 600 - 624) 2 

1 2 [ l 2 + 1 2 + (- 1) 2 + (- 1) 2 + 2 2 + (- 2 ) 2 ] x 4 " 48 ~ 12 


Suma de Cuadrados de la Interacción A cuadrátko x B lineal 

[(200 + 276 + 224) -(160 + 112 + 448)1" 

SCA-, B, = - -—- 

[l 2 + l 2 + (-1) 2 + (-1) 2 + 2 2 + (-1) 2 ] x4 
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sca 2 b 2 

Suma de Cuadrados de la InteracciónA cuadrático x B cuadrático 
[(200+176 + 160+ 112 + 672) -(448+ 336+ 224 +240)] 2 5184 

" [l 2 

+ 1 2 +T +(-2) 2 + (-2) 2 +(-2) 2 +(-2) 2 +4 2 ]jc4 144 

ANAVAR (Modelo Fijo) 

F.deV. 

G. de L. SC 

CM 

F Ftab(5%) 

Ftab(l%) 

Trar 

8 

3072 

384 

3,388 2,36 

3,36 

A 

2 

672 

336 

2,965 3,40 

5,61 

A, 

1 

600 

600 

5,29** 4,26 

7,82 

A, 

1 

72 

72 

0,635n.s. 


B 

2 

2016 

1008 

8,89** 



1 

1944 

1944 

17,15** 


b 2 

1 

72 

72 

0,635n.s. 


AB 

4 

384 

96 

0,847n.s. 


A 1 B 1 

1 

36 

36 

0,318n.s. 


a,b 2 

1 

12 

12 

0,106n.s. 


a 2 b 1 

1 

300 

300 

2,649n.s. 


a 3 b 2 

1 

36 

36 

0,318n.s. 


Bloque 

3 

720 

240 

2,111 3,01 

4,72 

EE 

24 

2720 

113,33 



Total 

35 

6512 





Interpretación 

De acuerdo a los resultados del Análisis de Varianza se puede interpretar lo 
siguiente: 

La significación de los tratamientos es indicativo de que existen 
diferencias estadísticamente significativas al nivel 0,01 entre las medias de 
los nueve tratamientos. 


218 





Diseño y Análisis de Experimentos & 


-. Existen diferencias estadísticamente significativas al 10% entre los 
rendimientos obtenidos con las distintas dosis de Nitrógeno utilizados. 

El efecto de dichas dosis es lineal; es decir, se incrementa linealmente con 
el aumento de los niveles de Nitrógeno. 

-. Existen diferencias estadísticamente significativas al 1% entre los niveles 
de Fósforo utilizados en el experimento. 

-. El efecto de los niveles de Fósforo es lineal, se aumentan linealmente los 
rendimientos con los sucesivos incrementos de los niveles de Fósforo. 

-.No existe interacción entre los dos factores, cada uno actúa independien¬ 
temente del otro factor. 

-. No existen diferencias estadísticamente significativas al 5% entre los rendi¬ 
mientos obtenidos en los bloques. Lo que indicaría que los rendimientos 
del maíz obtenidos entre los mismos tratamientos en los distintos bloques 
no fueron tan diferentes como para hacer claramente eficiente el control 
local. Sin embargo, el valor de F fue de 2,11 significativo al 12% lo que 
indicaría cierto control local con el bloqueo. 

En conclusión; como la respuesta tanto del Nitrógeno como del Fósforo es 
lineal, los mejores rendimientos se obtienen con la máxima dosis utilizada de los 
dos factores objeto de estudio. 


EJERCICIOS 

Con un conjunto de datos afín a su área de investigación, responda las 
siguientes preguntas: 

- Establezca el modelo lineal aditivo describiendo cada uno de los 
términos del modelo y los subíndices presentes. 

- Dé los supuestos del modelo. 
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- Establezca las hipótesis a probar. 

- Escriba el cuadro de ANAVAR de acuerdo al modelo. Considere cuadrados 
medios esperados y los estadísticos de prueba. 

-Realice el ANAVAR. 

- Pruebe las hipótesis. 

- Interprete los resultados. 
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Capítulo 9 


REGLAS PARA LA ESPERANZA DE LOS CUADRADOS MEDIOS 


Los Cuadrados Medios juegan un papel sumamente importante en el análisis 
de varianza para probar la hipótesis nula. El conocimiento de la esperanza de los 
cuadrados medios (E.C.M.) en el análisis de varianza es lo que conduce al 
investigador a realizar la prueba de la hipótesis nula con el estadístico apropiado. 
Las reglas para su realización se enumeraran a continuación: 


Regla 1. Cada efecto tiene su componente de varianza (efecto aleatorio) o 
un factor fijo (efecto fijo) asociado a él. Si una interacción contiene por lo menos 
un efecto aleatorio, la interacción es declarada aleatoria. Un componente de varianza 
tiene letras griegas que identifican un efecto aleatorio particular. Por ejemplo, un 
modelo mixto con factor A fijo y factor B aleatorio el componente de varianza 
para B es y el componente de varianza para AB es a) 2 ^ El efecto fijo será 
siempre representado por la sumatoria (Z) de los componentes del modelo 
asociado con ese factor, dividido por sus grados de libertad. En el ejemplo, el 
efecto de A es 



(9.1) 


Regla 2. Cuadrados medios esperados. Para obtener los resultados medios 
esperados, preparar la siguiente tabla: 


a) Una fila por cada componente del modelo (Cuadrado Medio) y una 
columna por cada subíndice; sobre cada subíndice escribir el número de niveles 
del factor asociado con el subíndice y si el factor es fijo escribir una F o si es 
•aleatorio escribir una R. Las repeticiones o replicaciones son siempre consideradas 
como aleatorias. 
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b) En la última fila,, escriba “1” si uno de los subíndices (muertos) en el 
componente de la fila corresponde al subíndice de la columna. Por ejemplo; 



F 

F 

R 

Factor 

a 

b 

r 


i 

j 

k 

T. 

i 

n 




(tPbj 




£ ¡j(k) 

i 

1 

i 


c) En cada fila, si cualquiera de los subíndices en el componente de la fila 
corresponde al subíndice de la columna, se escribe cero en la columna si es 
encabezada por un factor fijo y 1 si la columna es encabezada por un factor 
aleatorio. 



F 

F 

R 

Factor 

a 

b 

r 


i 

i 

k 

T. 

i 

% 

0 

0 



0 

0 


£ u« 

1 

1 

i 


d) En cada una de las posiciones vacías de la fila escriba el número de 
niveles indicados en el encabezamiento de la columna. 
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F 

F 

R 

Factor 

a 

b 

r 


i 

) 

k 

T. 

\ 

0 

b 

r 


a 

0 

r 

( T P),, 

0 

0 

r 

£ ¡j(l<> 

1 

1 

i 


e) Para obtener el cuadrado medio esperado (ECM) para cualquier 
componente del modelo, primero cubra todas las columnas encabezadas por 
subíndices presentes (vivos) en ese componente, en cada fila que contiene por lo 
menos el mismo subíndice como los del componente a ser considerado, tomar el 
producto de los números visibles y multiplicar por el factor apropiado fijo o 
aleatorio (Regla 1). La suma de estas cantidades es la ECM del componente del 
modelo a ser considerado; a fin de encontrar, por ejemplo, la ECM(A) tome la 
columna i del cuadro. 

El producto de los números visibles en las filas que contienen el subíndice 1 son: 
br en la fila 1 0 en la fila 3 1 en la fila 4 

Entonces laECM(A) será 


a 

ECM(A) = (T+br Yj X. 2 /(a -1) 
1=1 


(9.2) 
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EJEMPLOS 




a) En el caso de dos factores 

en modelo fijo: 


F 

Factor a 

i 

F 

b 

) 

R 

r ECM 

k 


T. 0 

b 

a 

r G> 2 + br 

i=l 

X, 2 I (a-l) 

P, 

0 

b 

r O* 2 + ar 

>1 

PjV (b-1) 

(tP) s o 

0 

a b 

r a J + r X X 
i=\ y'=i 

( x P)¡j 2 / ( a "l) (b-1) 

£ ¡j(k) 1 

1 

i a 2 



b) En el caso 

de dos factores en 

modelo aleatorio: 


R 

R 

R 


Factor 

a 

b 

r 

ECM 


i 

j 

k 


r 

i 

b 

r 

O 2 + r CJ 2 + br CT 2 
t|3 t 

P, 

a 

1 

r 

CT + r CJ 2 + ar C7 ; 

tP p 

í'cP), 

i 

1 

r 

a 2 + tG 2 

tP 

^¡í») 

i 

1 

i 

C? 


224 









Diseño y Análisis de Experimentos 9 


c) En el 

caso de dos factores 

en modelo 

mixto: 



F 

R 

R 



Factor 

a 

b 

r 

ECM 



i 

j 

k 



r 

0 

b 

r 

& + r o 2 + br 
ip 

a 

Yj y 2 / (a-l) 
1=1 

P, 

a 

1 

r 

CT 2 +ar (7 2 

P 


(tp), 

0 

1 

r 

CT 2 + r a 2 

tP 


e .j« 

1 

1 

i 

O 2 



A manera de ejercicio, considere un experimento factorial de tres factores 
con a niveles del factor A, b niveles del factor B y c niveles del factor C y r 
repeticiones. 

- asuma modelo fijo 

- asuma modelo aleatorio 

- asuma modelo mixto con Ay B fijos y C aleatorio. 


El modelo lineal es: 

Y m = V + a i + Pj + T x + (ctp) ij +(ax) ik + (Px) jk + (aPx) ijk + e.. h (9.3) 

Observe que e ¡jkl es la interacción de tratamientos simples (todas las 
combinaciones posibles) por repeticiones. Utilice las reglas dadas para las ECM 
y discuta la prueba de la hipótesis nula. 
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Note que en los modelos mixtos las interacciones que contienen factores 
fijos y aleatorios tendrán además los coeficientes dados por las reglas estudiadas 
para las varianzas, el coeficiente del factor fijo. Por ejemplo, en el caso planteado, 
la interacción AC, BC y ABC tendrán como ECM: 

a 

ECM AC) = cr 2 + br- <5 (9.4) 


b 2 

ECM(BC) = a 2 + ar-a 2 

b-1 


a b 

ECM(ABC) = a 2 + r- 

a - 1 b-1 


2 

<7 

afk 


(9.5) 


(9.6) 
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Capítulo 10 

EXPERIMENTOS FACTORIALES CONFUNDIDOS 


Introducción 

El investigador agrícola puede estar interesado en estudiar varios factores 
simultáneamente, esto se hace a través de los experimentos factoriales estudiados 
en el capítulo anterior. Sin embargo a medida que se incrementa el número de 
factores y niveles de cada factor, aumenta simultáneamente el número de 
combinaciones de tratamientos a experimentar. Bajo esta situación el hecho de 
colocar los tratamientos en bloques completos al azar, puede disminuir la eficiencia 
de las estimaciones, al tener en el experimento una mayor heterogeneidad en el 
material experimental. Se puede recurrir al uso de bloques incompletos, en otras 
palabras, utilizar bloques que tengan solamente una parte del conjunto total de 
tratamientos. 

Esta solución presenta dos consecuencias: 

* Los bloques incompletos controlan la heterogeneidad intrabloques. 

* El uso de bloques incompletos trae consigo una confusión de efectos que 

se debe estudiar con detenimiento. 

SISTEMAS CONFUNDIDOS 

Para diseñar un experimento en el cual el número de tratamientos que va a 
ser colocado en un bloque es menor que el número total de combinaciones de 
tratamientos, el experimentador debe decidir primero cuales son los efectos que 
va a confundir. Si hay sólo una interacción en el experimento y decide confundir 
esta interacción con bloques, el problema es simplemente decidir cuales 
combinaciones de tratamientos ubicar en cada bloque. Una forma de hacer esto, 
en el 2 k , es colocar en un bloque aquellas combinaciones de tratamientos con un 
signo (+) en el efecto a ser confundido y aquellas con signo (-) en el otro bloque. 
Cuando el número de tratamientos y de bloques aumenta, es necesario aplicar un 


227 



Dr. Frankíin Chacin 


método más general. Primero, se define un contraste de definición. Esta es 
simplemente una expresión que establece cuales efectos van a ser confundidos 
con bloques. 

Un ejemplo sencillo constituye el 2 2 para confundir AB, se escribe entonces 
AB como el Contraste de Definición. Una vez definido el contraste, existen 
varios métodos para determinar cuales combinaciones de tratamientos se ubican 
en cada bloque. Un método consiste en ubicar en un bloque las combinaciones 
de tratamientos que tienen signo positivo en AB y en el otro aquellas que tienen 
signo negativo. 

Otro método es considerar cada combinación de tratamientos. Aquellas 
que tienen un número par de letras en común con las letras del efecto en el 
contraste de definición van en un bloque. Las que tienen un número impar de 
letras en común con el contraste de definición van en el otro bloque. Aquí (1) no 
tiene ninguna letra en común con el contraste de definición; es decir tiene cero 
letras en común, lo cual se considera como un número par; a tiene una letra en 
común con AB, es decir un número impar; b también tiene una letra en común 
con AB y ab tiene dos letras en común con AB. Por lo tanto quedarían dos 
bloques, en uno se incluyen los tratamientos (1) y ab y en el otro bloque los 
tratamientos a y b. 

Una desventaja de estos dos métodos es que ellos sólo sirven para factoriales 
2 k . Un método más general se atribuye a Kemptorne y se explicará más adelante 
en detalle. 
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EXPERIMENTOS FACTORIALES 2 3 

Supongamos que se desean ensayar tres factores, digamos A, B y C, cada 
uno a dos niveles, y se aplica un factorial 2 3 , confundido en r réplicas. 


Réplica I Réplica r 


Bloque 1 

Bloque 2 

Bloque 1 

Bloque 2 

ac 

a 

(1) 

c 

(1) 

c 

ac 

b 

ab 

abe 

be 

abe 

be 

b 

ab 

a 


El Anavar correspondiente para un factorial completamente confundido 2 3 sería: 


ANAVAR 


F.deV. 

G.deL. 

Bloques 

2r-l 

A 

1 

B 

1 

AB 

1 

C 

1 

AC 

1 

BC 

1 

Error 

6(r-l) 

Total 

8r-l 


Con bloques de cuatro unidades experimentales, la varianza de estimación 
de los efectos factoriales estimables es: 

er 2 /2r (10.1) 
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Si el experimento se hubiese realizado en bloques completos al azar, todos 
los efectos factoriales habrían sido estimables y la varianza de estimación de 
cualquiera de ellos habría sido: 


0 2 )'/2r (10.2) 

Supuestamente (rr 2 )' > a 1 ■ Entonces la eficiencia relativa de estimación 
en bloques incompletos con respecto al diseño en bloques completos es: 

[ {o 2 )' / 2r ]/[ a 2 / 2r ¡= (cr 2 )'/ a 2 >1 (10.3) 

COMPOSICION DE LOS BLOQUES BAJO DETERMINADO 
ESQUEMA DE CONFUSION 

Existen varias maneras de determinar la composición de los bloques 2 k , sin 
embargo, el método general es el de Kempthorne explicado más adelante y 
ejemplificado para factoriales 3 k . 

Esquemas típicos de confusión 2 k 

2 3 en bloques de 4 unidades: cualquier efecto o interacción 
en bloques de 2 unidades: i) A, B, AB 

ii) A, B, ABC 

iii) AB, BC, AC 

2 4 en bloques de 8 unidades: cualquier efecto o interacción 
en bloques de 4 unidades: i) A, B, AB 

ii) A,BC, ABC 

iii) A, BCD, ABCD 

iv) AB, BC, AC 

v) AB, CD, ABCD 

vi) ABC, ACD, AD 

en bloques de 2 unidades: i) A, B, AB, C, AC, BC, ABC 

ii) A, B, AB, C, ACD, BCD, ABCD 

iii) A, BC, ABC, BD, ABD, CD, ACD 

iv) AB, AC, BC, AD, BD, CD, ABCD 
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La elección del esquema de confusión dependerá de las necesidades u 
objetivos del investigador. Sin embargo, puede verse que, por ejemplo, para un 
diseño 2 4 podría seleccionarse el esquema v) o el vi). Si se utilizaron el i), el ii) o el 
iii) se estarían confundiendo efectos principales; si, por otra parte, se eligiera el iv) 
se estarían confundiendo todas las interacciones de dos factores, mientras que en 
el v) y vi) sólo se confunden dos y una de ellas, respectivamente. 

Fisher enunció un teorema que establece las características que debe llenar 
un experimento factorial de la familia 2 k , para que ninguna de las interacciones 
confundidas comprenda menos de tres factores. 

Teorema de Fisher 

Sea un experimento factorial 2 k en bloques de 2 m unidades experimentales ( 
k > m), si 2 m > k, se pueden encontrar arreglos en los que ninguna interacción 
confundida con bloques contenga menos de tres factores. 

Ejemplo: 

En un factorial 2 7 en bloques de 2 3 unidades experimentales, k = 7 y m=3, de 
manera que 2 k = 2 3 = 8 > n = 7. De acuerdo con el teorema de Fisher es posible 
construir un esquema de confusión tal que los efectos confundidos con bloques 
sean sólo interacciones de tres o más factores. 

Los efectos o interacciones independientes que existen en un determinado 
esquema de confusión son llamados comúnmente generadores. En un 
experimento 2 k en bloques de 2 m unidades experimentales se tendrán 2 k ' m =2 q 
bloques, requiriéndose q generadores para definir el esquema de confusión. 

Suponiendo que se cumple el teorema de Fisher, puede procederse como sigue: 

* Si se requiere q generadores, deben escribirse las primeras k-q letras 

mayúsculas. 

* Se construyen q interacciones cualesquiera con las letras anteriores. 

* Con las q interacciones y los q efectos no considerados (las q letras no 

consideradas) combinados en pares se obtiene un conjunto de q generadores. 
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Ejemplo: 

Consideremos un factorial 2 7 en bloques de 2 3 unidades experimentales 
(cumple con el teorema de Fisher). 

Pueden construirse 2 7 ' 3 = 2 4 bloques; de acuerdo con la notación utilizada q 
= 4yk-q=3,o sea que con A, B y C se construyeron 4 interacciones AB, AC, 
BC y ABC, y como han quedado sin considerar los factores D, E, F y G, al 
combinarlos en pares podemos obtener diversos conjuntos de generadores. Por 
ejemplo: ABD, BCF y ABCG; o ABG, ACF, BCE y ABCD; o ABF, ACG, BCD 
y ABCE; o cualquier otra combinación. 

Ejemplo: 


Se ensayan las combinaciones de un factorial 2 3 , para estudiar el efecto de 
Nitrógeno (n), Fósforo (p) y Potasio (k), sobre el rendimiento de un cultivo de 
maíz. La interacción NPK se ha confundido con bloques en las tres repeticiones. 
Se desea obtener el análisis de varianza del experimento, para el rendimiento del 
cultivo. 

Repl 
Bloque 1 



98.02 


90,95 
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Bloque 4 


np 

23,59 

nk 

22,59 

(1) 

23,36 

P k 

22,14 


RepIII 
Bloque 5 
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El esquema de confusión usado es el anteriormente descrito: 

Bloque A (1, 4, 6): (1) np nk pk 
Bloque B (2, 3, 5): n k p npk 


Cálculo de los efectos totales 


Totales de Tratamiento 


(1) 

69,99 

n 

86,76 

p 

73,94 

np 

78,84 

k 

70,76 

nk 

74,39 

pk 

68,72 

npk 

73,99 

G 

597,39 


Cálculo del factor de corrección 

„ G 2 (597,39) 2 

C = — = = 14.869,7838 


2 3 r 


24 


Cálculo de la suma de cuadrados total 

SCTotal = £y 2 -C = (22,45) 2 +...+(25.40) 2 -14.869,78 = 180,1867 

Cálculo de la suma de cuadrados debido a bloques 

cr , Z B ? „ (98,02) 2 +...+(102,24) 2 

SCB = - C = -----14.869,78 = 70,5734 
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Esta suma de cuadrados debido a bloques puede dividirse en: 


i) la suma de cuadrados debido a repeticiones 


SCR = 


I > 2 


-c = 


(188,97) 2 +(195,91) 2 +(212,51) 2 
8 


14.869,78 = 36,5773 


ii) la suma de cuadrados debido a bloques dentro de repeticiones 

Ib^r 2 

SC(BDR) = ^= L —‘- -— - 33,9961 
4 8 


El cálculo de las sumas de cuadrados debido a los efectos factoriales se 
realiza usando las ecuaciones 8.22 a 8.28. 


^ (30,57) 2 

SC(N) = 3 = 38,9385 

3x2 3 

(—6,41) 2 

SC(P) = - - 3 - - = 1,7120 

3x2 

(-10,23) 2 

SC(NP) = - ~ y ~ = 4,3605 

3x2 

(-21,67) 2 

SC(K) = ~~ = 19,5662 

3x2 

(-12,77) 2 

SC(NK) = = 6,7947 

(1,5 3) 2 

SC(PK) = 3 - 0,0975 

v 3x2 3 
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ANAVAR 

F.deV. 

G. de L. 

SC 

CM 

Fe 

Bloques 

5 

70,5734 



Rep. 

2 

36,5773 



BDR 

3 

33,9385 



N 

1 

38,9385 

38,9385 

12,25 : ' ,; - 

P 

1 

1,7120 

1,7120 

<1 

NP 

1 

4,3605 

4,3605 

1,37 

K 

1 

19,5662 

19,5662 

6,16* 

NK 

1 

6,7949 

6,7949 

2,14 

PK 

1 

0,0975 

0,0975 

<1 

Error 





Intrabloque 

12 

38,1439 

3,1787 


Total 

23 

180,1867 




De acuerdo con este análisis, el efecto del Nitrógeno es altamente significativo 
y el del Potasio significativo, sobre el rendimiento del maíz. 

CONFUSION PARCIAL 

Cuando se diseña un experimento factorial en bloques incompletos y se 
emplean dos o más repeticiones de los experimentos, no es necesario sacrificar 
totalmente la información de los efectos o interacciones que se confunden con 
bloques. Es posible que cada repetición se diseñe con un esquema diferente de 
confusión, pudiéndose así obtener información parcial sobre algunos efectos o 
interacciones de poco interés e información completa sobre el resto de los efectos 
factoriales, en los cuales está interesado el investigador. 

Para entenderlo mejor, se ilustrará la explicación con un ejemplo. Si se analiza 
el esquema de la figura siguiente, la cual corresponde a un experimento factorial 
2 3 , en el cual se confunde AB en las repeticiones de tipo I, AC en las repeticiones 
del tipo II, BC en las repeticiones de tipo III, y ABC en las repeticiones de tipo 
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IV. Aunque las repeticiones de tipo I no permiten estimar AB a partir de 
comparaciones dentro de bloques, las repeticiones II, III y IV, si dan infor maci ón 
sobre esta interacción. Se dice entonces que se tiene 3 A de información sobre AB, 
dado que de cuatro (4) unidades experimentales, tres (3) se utilizan para estimar 
AB. Lo mismo ocurre con las interacciones AC, BC y ABC, sobre las cuales 
también se obtiene las % partes de la información. 


ESQUEMA DE CONFUSION PARCIAL PARA UN FACTORIAL 2 3 


Refiérase al capitulo 8, en la matriz de transformación ortogonal y agrupe 
los tratamientos con signos coincidientes, en la interacción respectiva. 


Bloque 1 (1) ab c abe 
Bloque 2 a b ac be 
Repetición tipo I 
AB confundida con bloques 


Bloque 3 (1) b ac abe 

Bloque 4 a ab c be 

Repetición tipo II 
AC confundida con bloques 


Bloque 5 (1) a be abe 
Bloque 6 b ab c ac 
Repetición tipo HI 
BC confundida con bloques 


Bloque 7 (1) ab ac be 

Bloque 8 a b c abe 

Repetición tipo IV 
ABC confundida con bloques 


En cambio, sobre los efectos principales A, B y C, se obtiene la 
información completa, ya que ninguno de ellos se confunde con bloques. Este 
esquema es de confusión parcial y da lugar a la partición del ANAVAR, 
representado en la tabla siguiente, suponiendo que se hacen r réplicas del esquema 
básico de la figura anterior: 
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F.deV. G.deL. 


Bloques 8r - 1 

A 1 

B 1 

C 1 

AB a partir de repeticiones Tipos II, III y IV 1’ 

AC a partir de repeticiones Tipos I, III y IV 1' 

BC a partir de repeticiones Tipos I, II y IV 1’ 

ABC a partir de repeticiones Tipos I, II y III 1' 

Error 24r - 7 

Total 32r - 1 


Si denotamos con los signos {a 1 )' y a 2 > respectivamente, las varianzas 
intrabloques de los esquemas de bloques completos y en bloques de cuatro (4) 
unidades experimentales, podemos calcular la eficiencia de estimación del diseño 
en bloques incompletos, al diseño en bloques completos para los efectos principales 
, como (cr 2 )'/ cr 2 , dado que en ambos diseños se obtiene información 
completa. Como en general ( cr 2 )' / cr 2 se tendrá mayor eficiencia de estimación 
con el diseño de bloques incompletos. Para las interacciones AB, AC, BC y ABC 
las varianzas de estimación son (cr 2 )'/ 8r y cr 2 / 6r para el diseño en bloques 
incompletos y en bloques completos, respectivamente. Por consiguiente la eficiencia 
de estimación del diseño en bloques incompletos, con respecto al diseño en bloques 
completos está dada por: 

(o 2 )' /8r 3 (a 2 )' 

a 2 / 6 r 4 a 2 

Entonces, si cr 2 < 3(cr 2 )' / 4, el diseño en bloques incompletos será más 
eficiente para estimar las interacciones y substancialmente más eficiente para estimar 
los efectos principales. 
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Experimento simulado de dos factores A y B cada uno a dos niveles, que 
consta de dos réplicas de tres repeticiones completas. El esquema de confusión 
utilizado es el siguiente: 


REPETICION I 

: A confundido 

Bloque I (1,7) 

: (1) b 

Bloque II (2,8) 

: ab a 

REPETICION II 

: B confundido 

Bloque I (3,10) 

: ab b 

Bloque II (4,9) 

: (1) a 

REPETICION III 

: AB confundido 

Bloque I (5,11) 

: (1) ab 

Bloque II (6,12) 

: a b 

A confundido 



Bloque 



b 

(1) 

i 

50 

58 

2 

ab 

a 


58 

41 


Repetición I R = 207 
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B confundido 

Bloque 


3 

ab 

82 

b 

76 

4 

(i) 

a 


60 

8 

Repetición II 

R = 226 

AB confundido 

Bloque 


5 

(1) 

ab 


31 

7 

6 

b 

a 


32 

99 

Repetición III 

R = 169 

A confundido 

Bloque 


7 

(1) 

b 


26 

86 

8 

ab 

a 


55 

38 


Repetición I R = 205 


B 3 = 158 

B =68 

4 

B s = 38 

B t “131 

B 7 = 112 
B 8 = 93 
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Bloque 

B 9 =120 
B I0 =97 

Repetición II R = 217 


9 

(1) 

a 


69 

51 

10 

b 

ab 


41 

56 


AB confundido 


Bloque 


11 

(1) 

ab 


83 

37 

12 

a 

b 


61 

69 


B u =120 

B 12 =130 


Repetición III R = 250 


G = 1274 


Cálculo del Factor de Corrección 

G 2 1274 2 


C = - 


2 2 x6 


24 


67628,17 


Cálculo de la Suma de Cuadrados Total 

SCTotal = Xy 2 ” c = 50 2 +...+69 2 -67628,17 = 12739,83 
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Cálculo de la Suma de Cuadrados debido a Bloques Incompletos 

-C = 5351,83 


V B 2 

SCB = — C = 


108 2 +...+130 2 


2 ' 2 

Esta suma de cuadrados puede dividirse en: 


1.- SCRep = 


Zr 2 


-C = - 


207 2 +...+250 2 


■C = 896,83 


Zb? Zr 2 

2, SC(BDR) = L - — = 72980 - 68525 = 4425 


Cálculo de los totales de tratamientos sobre: 

i. - Repeticiones II y III 

ii. - Repeticiones I y III 

iii. - Repeticiones I y II 


Para calcular los efectos medios y las contribuciones a las sumas de cuadrados 
A, B y AB 


Tratamientos Rep II y III Rep I y III Rep I y II 


(1) 

243 

198 

213 

a 

219 

239 

138 

b 

218 

237 

253 

ab 

182 

157 

251 

Suma 

862 

831 

855 
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Cálculo de las sumas totales de tratamientos 
R ^ethbn^Hy m 

Aj = suma de los totales de trat. ayab = 219 + 182 = 401 
A 0 = suma de los totales de trat. (1) y b = 243 + 218 = 461 
A, + A o = Total parcial sobre repeticiones II y ni = 862 

Repeticiones I y HI 

Bj = suma de los totales de trat. b y ab = 237 + 157 = 394 
B 0 = suma de los totales de trat. (1) y a = 198 + 239 =437 
Bj + B o = Total parcial sobre repeticiones! y EU = 831 


Repeticiones I y H 

AB t = suma de los totales de trat.(l) yab =138 +253 = 391 
AB 0 = suma de los totales de trat. ay b = 213 + 251 = 464 
ABj + AB o = Total parcial sobre repeticiones Iyn = 855 

Por lo tanto; 


_ a?+a? (a„+a,) 2 


16 


= 225 


SC(A) = 

SC(B)^-toí„ 5 , 


16 


57 


SC(AB): 


AB +ABf ÍAB + AB, V 

- 9 - L - v - 9 - L 4 333 07 

8 16 ’ 
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ANALISIS DE LA VARIANZA (ANAVAR) 


F.deV. 

G. de L. 

SC 

CM 

Fe 

Rep. 

5 

896,83 



BDR 

6 

4455,00 



A (2/3 

1 

225,00 

225,00 

<1 

B de 

1 

115,57 

115,57 

<1 

AB inf.) 
Error 

1 

333,07 

333,07 

<1 

Intrabloque 

9 

6714,36 

746,07 


Total 

23 

12739,83 




Ejemplo ilustrativo de un experimento factorial confundido 2 3 

En el siguiente cuadro se presentan los resultados de un ensayo realizado en 
Fertilización N.P.K. en maíz con un arreglo de tratamiento factorial 2 3 en un 
diseño experimental bloques al azar, con la interacción ABC completamente 
confundida. 


Rep 

abe 

a 

b 

c 

Total 

Rep 

ab 

ac 

be 

(1) 

Total 

I 

30 

16 

24 

19 

89 

I 

28 

16 

27 

8 

79 

II 

23 

16 

28 

16 

83 

II 

18 

25 

16 

10 

69 

m 

Total 

25 

19 

20 

16 

80 

III 

23 

22 

17 

18 

80 

Trat. 

78 

51 

72 

51 

252 


69 

63 

60 

36 

228 


Modelo Lineal Aditivo 

Y m = V + a, + fij + y k + + (ay) ik + (fiy) Jk + p l + s ijk¡ (10.5) 
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Y¡jki = observación 1-ésima del i-ésimo nivel del factor A, j-ésimo nivel 
del factor B y k-ésimo nivel del factor C. 
p = media general 

a¡ = efecto del i-ésimo nivel del factor A 
Pj — efecto del j-ésimo nivel del factor B 

( a P)ij = efecto de la interacción de primer orden del i-ésimo nivel del 

factor A con el j-ésimo nivel del factor B 

( a y)¡k ~ efecto de la interacción de primer orden del i-ésimo nivel del 
factor A con el k-ésimo nivel del factor C 

iPy ) jk = efecto de la interacción de primer orden del j-ésimo nivel del 
factor B con el k-ésimo nivel del factor C 
p¡ = efecto de bloques 
£ ¡j k i — error experimental 

Supuestos del Modelo: 

Modelo I (fijo) 

p, = o 
Z/,= o 

k=l 
a b 

i=l j=l 

É ¿ í a r) ik - o 

i=l k=l 

I É (Pr) Jk = 0 

j=l k=l 

p¡ ~ NID (0, a 2 p ) 

£ ijk ~ NID (0, cr;) 
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Modelo II (Aleatorio) 

< 2 r. ~ NID(0, al) 
$~NID(0,o¿) 
y k — NID (0, Oy ) 
( a P)¡j ~ NID(0,crL) 
(ay) ik — NID (0, cr ) 
(Pr) jk ~NID(0,o¿) 
Pi — NID (0, a 2 p ) 


% - NID (0,0-;) 


Hipótesis: 


Modelo I 


Ho: a ¡ = 0 

Ho: (aP) v = 0 

Ha: a¡ 0 

Ha: {aP) g * 0 

Ho: Pj= 0 

Ho: {ay) a k = 0 

Ha: P¡ * 0 

Ha: (ay) ik * 0 

Ho: y k = 0 

Ho: (/?/) y * = 0 

Ha: y k 0 

Ha: (Py) jk * 0 

Modelo II 


Ho: cr] =0 

Ha: a 2 a * 0 

Ho: Opa = 0 

Ha: a afi * 0 

Ho: o-l=0 

Ha: o** 0 

Ho: o^ = 0 

Ha: o^ * 0 

Ho: a 2 = 0 

Ha: a y 5* 0 

Ho: a 2 = 0 

Ha: a% * 0 


Ho: a 2 = 0 
Ha: ¿rj * 0 


Ho: <T^=0 
Ha: a\*0 
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Esquema del Análisis de Varianza 

ANAVAR 

SIN CONFUSION 

F. de Y G. de L. 

F. de V. 

CONFUSION DE ABC 

G. de L. Componentes 

Repeticiones 

r-1 

Bloques 

r-1 = 5 

2 repeticiones 

1 interacción ABC 

2 EE de ABC 

Tratamiento 

abe - 1 

Tratamiento abc-2 = 6 

3 trat.bloque A 

3 trat.bloque B 

Error (r 

- l)(abc - 1) 

Error 

(abe - 2)(r -1) = 

12 

Total 

rabe - 1 

Total 

rabe - 1 



Desarrollo del Modelo 


A continuación se presentará, a manera de comparación, el Análisis de 
Varianza sin confusión y posteriormente se presentará confundiendo la interacción 
ABC. 
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ANAVAR SIN CONFUSION 

F.deV. 

G. de L. 

SC 

CM 

F F(5%) 

F(l%) 

Repeticiones 

2 

16.0 

8.0 

0.41n.s. 6.51 

3.74 

Trar 

7 

432.0 

61.71 

3.13* 4.28 

2.76 

A 

1 

73.5 

73.5 



B 

1 

253.5 

253.5 



C 

1 

24.0 

24.0 



AB 

1 

6.0 

6.0 



AC 

1 

13.5 

13.5 



BC 

1 

37.5 

37.5 



ABC 

1 

24.0 

24.0 



EE 

14 

276.0 

19.71 



Total 

23 

724.0 





Los cálculos para la Suma de Cuadrados cuando se está confundiendo la 
interacción ABC serían: 


Suma de Cuadrados de tratamiento 

SCTrat sin confusión - SC efecto confundido (ABC) 
SCTrat = 432-24.0 
SCTrat = 408 


Suma de Cuadrados de Bloque 


SCBloque = 


89 2 + 83 2 +...+69 2 +80 2 
4 


480 2 

24 


= 53 


Suma de Cuadrados Total 

, , , , 480 2 

SCTotal = 30 2 +16 2 +...+17 2 +18 2 --= 724 

24 


243 






Diseño y Análisis de Experimentos 10 


Suma de Cuadrados del Error Experimental 

SCEE - SCTotal- SCTrat- SCBloque = 724 - 408 - 53 = 263 

Los cálculos para los efectos principales e interacciones se realizan igual que 
los experimentos factoriales no confundidos. Los Cuadrados Medios o varianzas 
también se calculan en su forma convencional. 


ANAVAR CONFUNDIENDO ABC 


F.deV. 

G. de L. 

SC 

CM 

F 

F(5%) 

F(l%) 

Bloques 

5 

53.0 

10.6 

0.48n.s. 

2.11 

5.06 

Trat 

6 

408.0 

68.0 

3.10* 

3.00 

4.82 

A 

1 

73.5 

3.35n.s. 




B 

1 

253.5 

253.5 

11.57** 



C 

1 

24.0 

24.0 

1.09n.s. 



AB 

1 

6.0 

6.0 

0.27n.s. 



AC 

1 

13.5 

13.5 

0.61n.s. 



BC 

1 

37.5 

37.5 

1.71n.s. 



EE 

12 

263.0 

21.9 




Total 

23 

724.0 






En este experimento se aceptan las hipótesis nulas: Ho: ce¡— 0 , 

Ho: y k = 0 ,Ho: {a¡J)j- 0, Fio: {ay) ik = OyHo: ifiy) ]k = 0,por lo tanto 
no existen diferencias significativas entre los efectos de N, K, NP, NKy PK. 


Se rechaza la hipótesis nula Ho: /? — 0 con una probabilidad del 1%, por 
lo tanto existe efecto independiente de P. 


El efecto ABC se ha confundido porque en cada réplica el mismo contraste 
ABC se ha confundido con los bloques. La información sobre ABC se ha 
sacrificado en beneficio de bloques más pequeños, con lo cual se logra mayor 
homogeneidad y el Error Experimental será menor. En resumen, a expensas de 
ABC se gana un Error Experimental menor de forma que las otras comparaciones 
pueden hacerse en forma mas precisa. 
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EJERCICIOS 

Con un ejercicio que se apropie; 

- confunda totalmente la interacción ABC 

- confunda en la repetición I - ABC, en la repetición II - BC y en la 
repetición III - AB 

Responda las siguientes preguntas: 

- Establezca el modelo lineal aditivo, describiendo cada uno de los 
términos del modelo y los subíndices presentes. 

- Dé los supuestos del modelo. 

- Escriba las hipótesis a probar. 

- Describa el ANAVAR de acuerdo al modelo. Considere cuadrados 
medios esperados y el estadístico de prueba. 

-Realice el ANAVAR. 

- Pruebe las hipótesis. 

- Interprete los resultados. 
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CONFUSION PARA EL DISEÑO FACTORIAL 3 k 
Introducción 

Aunque las razones básicas y los resultados de confundir factores a 3 niveles 
son los mismos que los vistos para factores de dos niveles, la técnica involucrada 
es mucho mas sofisticada. El diseño 3 k puede confundirse en 3p bloques 
incompletos donde p < k, así estos diseños pueden confundirse en 3 bloques, 9 
bloques, etc. 

El problema que ahora surge es el de la ubicación: ¿Cuáles tratamientos van 
a ir en el mismo bloque? La ubicación de los tratamientos en los bloques depende 
de cuales tratamientos van a ser sacrificados. Generalmente se desea conservar 
los efectos principales (A, B y C) en primer lugar y después las interacciones de 
primer orden (AB, AC, BC) por lo tanto se confunde en general la interacción 
ABC. 

Supongamos que se desea confundir el diseño 3 k en 3 bloques incompletos. 
Estos bloques tienen dos grados de libertad y por lo tanto el número de grados 
de libertad confundidos con ios bloques deben ser dos. Es de recordar que en la 
serie factorial 3 k cada efecto principal tiene dos grados de libertad. 
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ANAVAR 


F.deV. 

G. deL. 

A 

2 

a l 

1 

A c 

1 

B 

2 

B l 

1 

B c 

1 


AB 

4 

W 

1 

a l b c 

1 

a c b l 

1 

A c B c 

1 

ABC 

8 

aac l 

1 

a l b l c g 

1 

A l B c^l 

1 

A l B c^c 

1 

AcBl^l 

1 

A c B l^c 

1 

A c B c^l 

1 

Ac B c^c 

1 


En el caso particular de un factorial 3 3 se tiene: 
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ESTRUCTURA DEL ANAVAR FACTORIAL 3 3 

F.deV. 

G. de L. 


Bloques 

r- 1 


Tratamientos 3 3 - 1 


A 

2 


B 

2 


AB 

2 


AB 2 

2 


C 

2 


AC 

2 


AC? 

2 


BC 

2 


BC 2 

2 


ABC 

2 


ABC 2 

2 


AB 2 C 2 

2 


Error 

8(r-l) 


Total 

3 3 r -1 



PROCEDIMIENTO GENERAL (Método de Kempthorne) 
Construir el contraste de definición. 


L — ct\X | + (10.6) 

donde: 

a¡ = exponente del i-ésimo factor de una combinación de tratamientos que será 
confundida. 

X¡ = nivel i-ésimo en una combinación particular de tratamientos. 
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Parala serie 3 k : 
a i = 0,1,2 
X =0,1,2 

Las combinaciones de tratamientos del diseño 3 k se asignan a los bloques 
con base en el valor de L (mod 3). En esta forma, se pueden definir tres (3) 
bloques en forma única, porque L (mod 3) puede tomar los valores 0,1 y 2. Las 
combinaciones de tratamientos que satisfacen L = 0 (mod 3) constituyen el bloque 
principal. Ejemplo: supóngase que se desea construir un diseño factorial 3 2 en 
tres bloques. Arbitrariamente, se elegirá AB 2 para confundir con bloques. 


Contraste de definición 


L = X, + 2X 2 (10.7) 

(0,0) :L = 1(0) + 2(0) = 0mod3 
(0,1): L = 1(0) + 2(1) = 2 mod 3 
(0,2): L = 1(0) + 2(2) = 1 mod 3 
(1,0) : L = 1(1) + 2(0) = 1 mod 3 

(1.1) : L — 1(1) + 2(1) = 0mod3 

(1.2) :L= 1(1) +2(2) = 2 mod 3 
(2,0) :L = 1(2) + 2(0) =2 mod3 

(2.1) ; L = 1(2) + 2(1) = 1 mod 3 

(2.2) : L = 1(2) + 2(2) = 0 mod 3 


Bloque 1 
0 0 

1 1 

2 2 


Bloc 

ue2 

0 

2 

1 

0 

2 

1 


Bloque 3 
0 1 

1 2 

2 0 
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En algunos casos experimentales es necesario confundir el diseño 3 k en 
nueve (9) bloques, por lo tanto se confundirán ocho (8) grados de libertad en los 
bloques. Para construir estos diseños, deben elegirse dos componentes de 
interacción y como resultado, dos más serán automáticamente confundidos, 
produciendo así los ocho (8) grados de libertad requeridos. Estos últimos 
corresponden a las interacciones generalizadas de los dos efectos elegidos 
originalmente. 

En el sistema 3 k las interacciones generalizadas de dos efectos (por ejemplo 
A y B, producen las interacciones generalizadas AB y AB 2 ). Sus contrastes de 
definición son: 


Lj = a l X l + a 2 X 2 +...+a k X k - U(mod3) donde U = 0,1,2 (10.8) 

L 2 = fiX } +/? 2 X 2 +...+AX k = h(mod3) donde h = 0,1,2 (10.9) 

donde a¡ y /? son los elementos de la primera y segunda interacción generalizadas. 
Las combinaciones de tratamientos que tienen el mismo par de valores (Z,, L 2 ) 
se asignan al mismo bloque. El bloque principal consta de las combinaciones de 
tratamientos que satisfacen (Z, = Z 2 = 0)mod3. 

Ejemplo: Diseño factorial 3 4 confundido en 9 bloques con 9 ensayos cada 
uno. Se elige confundir ABC y AB 2 D 2 . Sus interacciones generalizadas son: 

(ABC)(AB 2 D 2 ) = A 2 B 3 CD 2 = (A 2 B 3 CD 2 ) 2 - AC 2 D 

(ABC) ( AB 2 D 2 ) 2 = A 3 B 5 CD 4 = (B 2 CD) 2 = B C 2 D 2 

también están confundidas con los bloques. 
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Contrastes de definición 

L, =X,+X 2 +X 3 donde X, ,X 2 ,X 3 pueden tomar valores (0, 1, 2) (10.10) 
L 2 = X, +2X 2 +2X 4 donde X,,X 2 ,X 4 pueden tomar valores (0, 1, 2) (10.11) 


Bloque 1 

Bloque 2 

Bloque 3 

Bloque 9 

(L, L)=(0,0) 

1 2 

(Od) 

(2,2) 

(0,2) 

0000 

0002 

2000 

0001 

0122 

0120 

2122 

0121 

0211 

0212 

2211 

0210 

1021 

1022 

0021 

1020 

1110 

lili 

0111 

1112 

1201 

1200 

0202 

1201 

2012 

2010 

1012 

2011 

2101 

2012 

1101 

2100 

2220 

2221 

1220 

2222 


Diseño factorial 3 k confundido en 3 p bloques 

El diseño factorial 3 k puede confundirse en 3 P bloques con 3 k p observaciones 
cada uno y p < k. El procedimiento consiste en seleccionar p efectos independientes 
que serán confundidos con los bloques. Como resultado, automáticamente se 
confunden otros (3 p - 2p -1)/2 efectos. Estos corresponden a las interacciones 
generalizadas de los efectos elegidos originalmente. 
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Ejemplo: Diseño 3 7 confundido en 3 3 = 27 bloques. Como p = 3, deben 
seleccionarse 3 componentes de interacción independientes, y automáticamente 
confundir con otros [3 - (2x3)-l]/2= 10 efectos. Supóngase que se eligen 
ABC'DG, BCE 2 F 2 G y BDEFG. Usando estos efectos pueden construirse 
contrastes de definición y generarse los 27 bloques usando los métodos antes 
descritos. Los otros diez (10) efectos que se confunden con bloques son: 

(ABC 2 DG)(BCE 2 F 2 G) = AB 2 C 3 DE 2 F 2 G 2 = AB 2 DE 2 F 2 G 2 (mod3) 
(ABC 2 DG)(BCE 2 F 2 G) 2 = AB 3 C 4 DE 4 F 4 G 3 = ACDEF (mod 3) 


(ABC 2 DG)(BCE 2 F 2 G)(BDEFG) 2 = AB 4 C 3 D 3 E 4 F 4 G 4 = ABEFG (mod 3) 

Ejemplo Ilustrativo: Factorial 3 2 con bloques de tres unidades 
experimentales y un esquema de confusión parcial. Se ensayan dos factores A yB 
con dos réplicas de un esquema básico de dos (2) repeticiones completas. 
Repetición I: se construyeron los bloques confundiendo AB. 

Repetición II: se confundió el componente AB 2 de la interacción. 


Bloque 


1 

(0,2) 

(2,0) 

(1,1) 


19 

47 

28 

2 

(1,0) 

(o,i) 

(2,2) 


84 

3 

35 

3 

(2,1) 

(1,2) 

(0,0) 


23 

82 

8 


Repetición la: 
AB confundido 


Bloque 


4 

(2,2) 

(0,0) 

(1,1) 


34 

72 

41 

5 

(2,0) 

(o,i) 

(1,2) 


33 

91 

77 

6 


(0,2) 



46 

13 

19 


Repetición Ha: 
AB 2 confundido 
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Bloque 


Bloque 


7 

( 14 ) 

(0,2) 

( 24 ) 


65 

99 

20 

8 

( 24 ) 

( 04 ) 

(1,0) 


30 

72 

4 

9 

(o,o) 

( 24 ) 

(1,2) 


17 

3 

62 


Repetición Ib: 
AB confundido 


10 

( 04 ) 

(2,0) 

(1,2) 


97 

75 

28 

11 

(1,0) 

( 24 ) 

(0,2) 


32 

9 

12 

12 

( 14 ) 

(o,o) 

(2,2) 


46 

67 

96 


Repetición Ilb: 
AB 2 confundido 


Puesto que AB está confundido con bloques en las repeticiones tipo I, su 
efecto se estimará a partir de las repeticiones tipo II. Por el contrario, el efecto de 
AB 2 se estimará a partir de las repeticiones tipo I. 
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TOTALES DE TRATAMIENTOS(FACTORIAL 3 2 ) 


Repeticiones Totales 


Tratamientos 

la 

Ha 

Ib 

Ilb 

Tij Tij(I) Tij(U) 

(0.0)1* 

8 

72 

17 

67 

164 

25 

139 

(1,0) 

84 

59 

4 

32 

179 

88 

91 

(2,0) 

47 

33 

20 

75 

175 

67 

108 

(0,1)T 01 

3 

91 

72 

97 

263 

75 

188 

(1,1) 

28 

41 

65 

46 

180 

93 

87 

(2,1) 

23 

46 

3 

9 

81 

26 

55 

(0,2)T o2 

19 

13 

99 

12 

146 

118 

25 

(1,2) 

82 

77 

62 

28 

249 

144 

105 

(2,2) 

35 

34 

30 

96 

195 

65 

130 

Suma 

329 

466 

372 

462 

1629 

701 

928 


Tij = Totales de trat. sobre todas las repeticiones 
Tij(I) = Totales de trat. sobre repeticiones de tipo I 
Tij(EI) = Totales de trat. sobre repeticiones de tipo II 
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TOTALES DE BLOQUES. FACTORIAL 3 2 . 


Bloque 


Bloque 

B k 

Bloque 

B k 

Bloque 

B k 

1 

94 

4 

147 

7 

184 

■1 

200 

2 

122 

5 

201 

8 

106 


53 

3 

113 

6 

118 

9 

82 

m 

209 


PASOS PARA REALIZAR EL ANALISIS ESTADISTICO 


1.- Cálculo del factor de corrección 


C = 


G 2 1692 2 


3 2 r 9x4 


= 73712 


2.- Cálculo de la Suma de Cuadrados Total 

SCTotal = Xy 2 ~C = 19 2 +47 2 +...+96 2 —C = 31891 


3.- Cálculo de la Suma de Cuadrados debido a bloques 

X B 2 94 2 +...+209 2 ^ 

SCBloques = ^ - C =-—-- C = 9864 


4.- Cálculo de la SC(A) 

Esta suma requiere de la obtención de los totales (A) 0 , (A)j, (A) 2 

(A) 0 = T 0 = T 00 + T 01 + T 02 = 164 + 263 + 143 = 570 
(A), = T, « T 10 + T n + T 12 = 179 + 180 + 249 = 608 
(A), = T 2 = T 20 + T 21 + T 22 = 175 + 81 + 195 = 451 
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SC(A) = 


(A)S+(A)f+(A)j 


570 2 +608 2 + 451 2 

■C =-—-- C = 1118 

3x4 


5.- Cálculo de la SC(B) 

Esta suma requiere de la obtención de los totales (B) 0 , (B)^ (B) 


(B) 0 = T- 0 = T 00 + T 10 + T 20 = 164 + 179 + 175 = 518 
(B)j = T.j = T 01 + T u + T 21 =263 + 180 + 81 = 608 
(B), = T. 2 = T 02 + T 12 + T 22 = 143 + 249 + 195 = 587 

SC(B) = (B ) ;+(B):+(B) - -C^ + S24 ^ 587i -C^ 2 44 
3r 3x4 

6.- Cálculo de la SC(AB) 

Esta suma requiere de la obtención de los totales (AB) 0 , (AB)(AB), 


(AB) 0 = T 0(W + T ]2(n) + T 2im = 139 + 105 + 55 = 299 

( AB )i “ T 01( n) + T iopi) + T 22 p k =188 + 91 + 130 = 409 

(AB) 2 = + T 20 ^ + Tjjpjj =25 + 108 + 87 = 220 


SC(AB) 


(AB)q +(AB), +(AB) 2 [(AB) 0 4-(AB), +(AB) 2 ] 2 


299 2 + 409 2 + 220 2 (299 + 409 + 220) 2 

SC(AB) =-----—-— = 3003 

o 18 
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7.- Cálculo de la SC(AB 2 ) 

Esta suma requiere de la obtención de los totales (AB 2 ) 0 , (AB 2 )^ (AB 2 ) 2 

(ABV T »b + T « + T « - 25 + 93 + 65 - 183 
(AB>), - T 11{]) + T„„ + T 1|=1 .118 + 88 4 26 - 232 
m * 7» + 7» + 7» - 75 + 144 + 6 - 286 

_(AB ! );+(ABq;+(AB ! )’ [(AB í ) t +(AB ¡ ) 1+ (AB ! ) ! ] i 

SC(AB )= SÍ 9x2 

, 183 2 +232 2 +286 2 (183 + 232 + 286) 2 ooc 

SC(AB 2 ) =----^-= 885 


8.- Construcción del ANAVAR 


ANAVAR DE UN FACTOR 3 2 CON CONFUSION PARCIAL 


F.deV. 

G.deL. 

SC 

CM 

Fe 

Bloques 

11 

9864 

897 

<1 

A 

2 

1118 

559 

<1 

B 

2 

244 

122 

<1 

AB (Rep. II) 

2 

3003 

1502 

1,43 

AB 2 (Rep.l) 

2 

885 

442 

<1 

Error 

16 

16777 

1049 


Total 

35 

31891 




Si no se presentan efectos confundidos sería más conveniente condensar los 
resultados en la forma siguiente: 
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INTERACCIÓN DE AxB IGNORANDO CONFUSION 


a 



0 

1 

2 

SUMA 

0 

164 

179 

175 

518 

b 1 

263 

180 

81 

524 

2 

143 

249 

195 

587 

SUMA 

570 

608 

451 

1629 


SC(A) se obtiene a partir de los totales por columnas. 

SC(B) se obtiene a partir de los totales por filas. 

Y T 2 

5 C(AxB) = - SC(A) - SC(B) - C 

164 2 + +195 2 

SC(AxB) -- j --1118-224-73712 = 446812 


La suma de cuadrados atribuible a bloques, se refiere a repeticiones completas 
y no a bloques incompletos, produciendo: 


SCBloques = 


329 2 +466 2 +372 2 +462 2 


• C = 1535 


ANAVAR DE UN FACTOR 3 2 EN BLOQUES COMPLETOS 


F.deV. 

G.deL. 

SC 

CM 

Fe 

Bloques 

3 

1535 

512 

<1 

A 

2 

1118 

559 

<1 

B 

2 

244 

122 

<1 

AxB 

4 

4468 

1177 

1,09 

Error 

24 

24526 

1022 


Total 

35 

31891 
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FACTORIAL S n , S=P m , DONDE P ES UN NUMERO PRIMO 

Sean X p X 2 ,... X n las combinaciones de tratamientos, en las que cada Xi 
tan aunvabr0,l,2,... fe-l)y ju ü , , M( S -i) son las marcas del campo 

de Galois, el efecto principal del primer factor resulta al comparar las s medias 
de efectos de tratamientos, para las cuales, las relaciones: 

Xj = 0,1,2,..., (s-1) 

Mxi ~ Mo > M\ > Mi > ••• > 

se satisfacen satisfactoriamente. 

El efecto principal del segundo factor, es el resultado de comparar las medias 
de los efectos de tratamientos que satisfacen: 

X 2 =0,1,2,..., (s-1) 

fJ-xi = Ma > M\ > Ih. > ••• > 

y así sucesivamente. 

La interacción de los primeros dos (2) factores tiene (s -1) 2 grados de 
libertad, que se pueden dividir en componentes ortogonales de (s -1) grados de 
libertad definidos por: 


Mx\ + t^xi Ao » M\ > Mi > ••• > (10.12) 

donde la suma toma algunos de los valores // 0 , //,, jUj ,..., M( s -\) ■ 

La interacción entre los tres (3) primeros factores tiene (s -l) 3 grados de 
libertad, que se pueden dividir en (s -l) 2 componentes ortogonales dados por: 

Mxi + Mx 2 + Mxi = f*\ > /fz > ••* > ^o-i) (10.13) 

Si (Xj, X 2 ) son las combinaciones de tratamientos para el factorial 4 2 , se tiene: 
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Mx\ = Ao > Ai > A 2 > fh e f ect o principal de A 

/d xl = Ao > A, , /¿2 , A 3 efecto principal de B 

ju xi + //, /u X2 = JJ 0 , //,, componente de la interacción AB 

Mx\ + Mi Mxi = Ao > /A , A 2 , /q componente de la interacción AB 2 

Ajn + A 3 Ax 2 = Aó > Ai> /A > Ab componente de la interacción AB 3 

Para un experimento factorial 4 2 se tiene la siguiente combinación de 
tratamientos: 


(0,0) 

( 0 , 1 ) 

(0,2) 

(0,3) 

(1,0) 

(1,1) 

(1,2) 

(1,3) 

(2,0) 

(2,1) 

(2,2) 

(2,3) 

(3,0) 

(3,1) 

(3,2) 

(3,3) 


Pero si se considera que bloques de dieciseis (16) unidades experimentales 
son demasiado grandes para controlar la heterogeneidad, un esquema de tamaño 
4 que da información completa sobre los efectos principales y 2/3 de inf or ma ción 
sobre la interacción. 

Se tiene entonces: 


Bloq 

Repetición I 

Bloq 

Repetición II 

Bloq 

Repetición DI 

1 

(,)(,)(,)(,) 

5 

(,)(,)(,)(,) 

9 

(,)(,)(,)(,) 

2 

(,)(,)(,)(,) 

6 

(,)(,)(,)(,) 

10 

(,)(,)(,)(,) 

3 

(,)(,)(,)(,) 

7 

(,)(,)(,)(,) 

11 

(,)(,)(,)(,) 

4 

(,)(,)(,)(,) 

8 

(,)(,)(,)(,) 

12 

(,)(,)(,)(,) 


AB confundido AB 2 confundido AB 3 confundido 

Para la asignación de los tratamientos se utiliza el Campo de Galois. 

Sean las operaciones F = (F: #,*) que cumplen las siguientes propiedades: 
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1.- (a#b)#c = a#(b#c) Propiedad asociativa 

2- (a*b)*c = a*(b*c) Propiedad asociativa 

3Existe I tal que I#a = a#I = a, I e F 

4. - Existe I tal que l*a = a*I = a, I £ F 

5. -Existe a'#a=a#a' =1 

6. - Existe a'*a = a*a' = I 

7. - a#(b*c) = a#b * a#c Propiedad distributiva 


Entonces se dice que estas operaciones constituyen un Campo de Galois. 
Para la aplicación de los tratamientos, se definen las siguientes operaciones dentro 
de un Campo de Galois: 


+ 

Ao P, P 2 Pa 

Po P, P 2 Pa 

Po 

Po P, Pa Pj Po 

Po Po Po Po 

Pl 

Po Pa P 2 Pi 

P, P 2 Pa 

p 2 

Po P> P 2 

Pa P. 

Pa 

Po Pa 

P 2 


En la repetición I se tendrá AB confundido. Para AB confundido, se tiene 
p xl + p, =|4 0 ,|4,, (4, |4 3 Se tiene para los tratamientos, utilizando las operaciones 
+ y. definidas anteriormente: 

(o,o)=p 0 + p,p 0 =p 0 +p„=p 0 

(O,l) = p 0 +|4,|4 = |4 0 +|4, =P, 

(0,2)=|4 0 + (4,(4,= P 0 + (4 2 =(4 2 
(0,3) = (4 0 + p,p 3 = p 0 + P3 = |4 3 
(1,0) = H, +|4,P 0 =P,+(4 Ü =|4, 

(1.1) = |4, +P,P, = |4,+P,= |4 0 

(1.2) = (4, +|4,(4 2 =(4,+H 2 =|4 3 

(1.3) =(l, +P,P3=P,+P3=P 2 
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(2,0) 

= Mi 

+ H.W, 


= Hi 



(2,1) 


+ IV 1 , 

= ^ 2 + ^, 

= Mí 



(2,2) 

=Ps 


= ^ 2+^2 

= M» 



(2,3) 

= Mi 


= R 2 + R3 

= h 



(3,0) 

= ^3 

+ Wo 

= f l 3 + R 

rh 



(3,1) 

= 1^3 


=d 3 +m-, 




(3,2) 


+ *M>s 

= M3 + |3 2 

= R 



(3,3) 

= ^3 

+ 1MR 

= ^ 3 + h 

= l*o 



De manera que queda: 





Bloque 

Repetición I 




1 


(0,0) 

(1,1) 

(2,2) 

(3,3) 


2 


(0,1) 

(1,0) 

(2,3) 

(3,2) 


3 


(0,2) 

(1,3) 

(2,0) 

(3,1) 


4 


(0,3) 

(1,2) 

(2,1) 

(3,0) 


De manera similar se procede con AB 2 confundido, con el contraste 

Mx i M-o ’M'i»M"2 5 IR 

Bloque Repetición II 


1 

(o,o) 

(1,3) 

(2,1) 

(3,2) 

2 

(0,3) 

(1,0) 

(2,2) 

(3,1) 

3 

(0,1) 

(1,2) 

(2,0) 

(3,3) 

4 

(0,2) 

(1,1) 

(2,3) 

(3,0) 
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De manera similar se procede con AB 3 confundido, con el contraste 
Mx\ MrM-Xj — P'o ’P'i > Ib, Ib. 

Bloque Repetición H[ 

1 (0,0) (1,2) (2,3) (3,1) 

2 (0,2) (1,0) (2,1) (3,3) 

3 (0,3) (1,1) (2,0) (3,2) 

4 (0,1) (1,3) (2,2) (3,0) 

_ANAVAR_ 


F.deV. 

G. de L. 

Repeticiones 

3r -1 

Bloques dentro 


de repeticiones 

9r 

A Información Completa 

3 

B Información Completa 

3 

AB 2/3 de información 

3 

AB 2 2/3 de información 

3 

AB 3 2/3 de información 

3 

Error 

36r - 15 

Total 

4^ 

OO 

i 

Y-> k 


Una vez ubicados los tratamientos dentro de los bloques, es necesario 
producir una aleatorización entre bloques de una repetición y entre tratamientos 
de un mismo bloque. 
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Considérese el siguiente ejemplo una vez realizada la aleatorización: 

Bloque 

Repetición I 





AB confundido 



Rj = 656 

1 

(3,2) 

(1,0) 

(o,i) 

(2,3) 



16 

29 

8 

60 

Bj = 113 

2 

(0,3) 

(3,0) 

(1,2) 

(2,1) 



19 

24 

64 

37 

B, = 154 

3 

(1,1) 

(o,o) 

(2,2) 

(3,3) 



82 

30 

16 

69 

B 3 = 197 

4 

(2,0) 

(3,1) 

(1,3) 

(0,2) 



27 

51 

45 

61 

B 4 = 184 

Bloque 

Repetición II 





AB 2 confundido 


R^ 1014 

5 

(1,2) 

(2,0) 

(0,1) 

(3,3) 



70 

98 

6 

76 

B 5 = 250 

6 

(2,2) 

(0,3) 

(3,1) 

(1,0) 



52 

75 

40 

84 

B = 251 

o 

7 

(3,2) 

(1,3) 

(2,1) 

(0,0) 



14 

60 

9 

98 

B 7 = 181 
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8 

(0,2) 

74 

(1,1) 

76 

(3,0) 

82 

(2,3) 

100 

B 8 = 332 


Bloque Repetición Eli 

AB 3 confundido 


ii 

00 

o 

9 

(2,2) 

(o,i) 

(1,3) 

(3,0) 



51 

82 

15 

86 

B 9 = 234 

10 

(0,3) 

(2,0) 

(3,2) 

(1,1) 



52 

75 

40 

84 

B 1C =153 

11 

(3,3) 

(0,2) 

(2,1) 

(1,0) 



47 

61 

44 

6 

B_ii“ 15 

12 

(1,2) 

(2,3) 

(3,1) 

(o,o) 



100 

22 

80 

60 

B u -262 


G = Rj + R, + R 3 = 2477 


F = 


2477 2 


4 2 .3 
SCTotal = 16 2 


=127823,52 


29 2 +...+60 2 - F. 


SCRep - 


656 2 +1014 2 +807 2 


16 


5C(Bloques dentro repeticiones) = 


F c - 4037,79 

Ib 2 I > 2 


16 


= 6122,94 
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Con estos resultados, 
tfectosfactoriales. 

se elabora la tabla siguiente para la estimación de los 

m a. b¡ 

(AB)¡ 

(AB 2 ); 

(AB 3 ), 

Todas las repeticiones 

Rep II, in 

Rep I, III 

Rep I, II 

Pe A o B o 

( AB )o 

(AB 2 )» 

(AB 3 ) 0 

Fi A , B , 

(AB), 

(AB 2 ), 

(AB 3 ), 

P 2 A 2 B 2 

(AB) 2 

(AB 2 ), 

(AB 3 ) 2 

B 3 A 3 B 3 

(AB), 

(AB 2 ), 

(AB 3 ), 

A 0 = suma sobre todas las repeticiones para las cuales p x , = p o ; es decir para los 
tratamientos (0,0), (0,1),(0,2) y (0,3) que son: 8 + 29 + 30 +... + 61 + 60 = 636 

B, = suma sobre todas las repeticiones para las cuales p x2 = (ap es decir para los 
tratamientos:(0,1), (1,1),(2,1), y(3,l)queson: 8 + 37 + 82 + 51 +.. + 80 = 524 
(AB)= suma sobre las repeticiones II y III para las cuales p x] + p^t^ = p;es decir, los 
tratamientos: (0,2), (1,3), (2,0) y (3,1) en la repetición II y III, que son: 74 + 61 + 60 + ... + 
80=430 

Así se llega a: 




ESTIMACION DE EFECTOS FACTORIALES 

p, A. B. 

r 1 i i 

(AB); 

(AB 2 ). 

(AB 3 ); 

Todas las rep. 
p 0 636 644 

Pj 640 524 

p, 518 659 

p 3 683 650 

Rep II, IR 

469 

394 

430 

528 

Rep I, El 

327 

314 

399 

423 

Rep I, II 

513 

439 

407 

311 


G 2477 2477 R 2 + R, = 1821 R, + R, = 1463 R, + R, = 1670 
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SCA = 


XA? 636 2 +640 2 +518 2 +483 2 


12 


12 


F = 1252,23 


X B 2 644 2 + 524 2 + 689 2 + 650 2 




12 


F c = 1017,56 


65 


SCAB = 


X(AB)f (R 2 + R 3 ) 2 469 2 +394 2 +430 2 +528 2 1821 2 


8 

32 

8 

32 

Z(AB 2 ) 2 

(R, + R 3 ) 2 

327 2 +314 2 +399 2 +423 2 

1463 2 

8 

32 

8 

32 

I(AB 3 ) 2 

(R, + R 2 ) 2 

513 2 +439 2 +407 2 +311 2 

O 

r- 

\o 

8 

32 

8 

32 


1070,35 


2629,37 
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Tabla 10.1. ANAVAR de un experimento Factorial 4 2 con confusión Parcial 


F.deV. 

G. deL. 

SC 

CM 

F 

c 

Repeticiones 2 

4037,79 

2018,90 

1,82 

BDR 

9 

6122,94 



A 

3 

1252,23 

417,41 

<1 

B 

3 

1017,56 

339,19 

<1 

AB 

3 

1233,84 

411,28 

<1 

AB 2 

3 

1070,35 

356,78 

<1 

AB 3 

3 

2629,37 

876,46 

<1 

Error 

21 

23299,40 

1109,50 



Total 


47 


40663,18 




Capítulo 11 


EXPERIMENTOS FACTORIALES CON 
EFECTOS PRINCIPALES CONFUNDIDOS 
PARCELAS DIVIDIDAS 


Introducción 

Una vez estudiados los experimentos factoriales y el principio del confundido, 
se quiere presentar un diseño experimental muy utilizado tanto en el campo como 
en el laboratorio donde se unen las aplicaciones de experimentos factoriales y el 
principio de confundido. 

Si la naturaleza de los niveles de un factor a: (a o , a p , a p ^) excluyen la 
utilización de unidades experimentales pequeñas o bien es conocido por el 
experimentador que dichos niveles difieren en rendimiento, los niveles de a pueden 
ser asignados a unidades relativamente grandes denominadas parcelas principales 
en un diseño de bloques aleatorios, cuadrado latino o cualquier otro diseño. Siendo 
tales parcelas grandes por la necesidad o por el diseño, a la vez es deseable comparar 
niveles de otro factor b: (b o , bj,..., b t ), que son ubicados aleatoriamente en 
parcelas divididas dentro de cada parcela principal y que se denominan sub¬ 
parcelas. Lo explicado corresponde a un arreglo factorial de los factores a y b 
cuyos niveles son p y q respectivamente, donde el efecto principal A tendrá p-1 
grados de libertad, confundido completamente con bloques incompletos o parcelas 
principales. En tal forma el diseño en parcelas divididas es un diseño de bloques 
incompletos. 

Los tratamientos de la parcela principal pueden ellas mismas representar un 
arreglo factorial k n x s ra , los tratamientos de la subparcela pueden también 
representar un arreglo factorial. La terminología tratamiento principal o secundario 
no necesariamente hace referencia a los niveles de un solo factor. En 
experimentación agrícola, la utilización de este diseño es amplia, en estudios sobre 
riego, fertilización, poblaciones, entre otros. 
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Ventajas del diseño en parcelas divididas 

1Facilita la utilización de unidades experimentales grandes por necesidad 
o por diseño para comparar tratamientos secundarios. 

2. - Incrementa la precisión sobre los bloques aleatorios, de los pq 
tratamientos contenidos en las sub-parcelas. 

3. - La precisión puede ser incrementada utilizando un diseño cuadrado 
latino o cuadrado latino incompleto. 


Desventajas del diseño en parcelas divididas 

1. - Los tratamientos de las parcelas principales son medidos con menor 
precisión que si ellos estuviesen en un diseño de bloques aleatorios de pq 
tratamientos. 

2. - La ocurrencia de datos perdidos conduce a una mayor complejidad 
del análisis. 


Aplicación de la aleatorización en este diseño 

1. - Depende del diseño utilizado: bloques aleatorios, cuadrado latino, 
entre otros. 

2. - Los tratamientos asignados a las parcelas también dependerán del 
diseño particularmente asignado. 
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Parcelas divididas en bloques aleatorios 

Niveles del factor para el efecto A: a 0 , a t , a 2 , a 3 p = 4 
Niveles del factor para el efecto B: b 0 , bj, b 2 q = 3 

Tratamientos: pxq = 4x3 = 12 
Repetición: r = 3 

Rep'I Rep II Rep III 

a ’> a i 3 2 a 0 a i a 0 a 2 a 3 a i S a o a 2 

b 2 b 2 b l b l b l b 0 b 0 b l b 2 b 2 b 0 b l 

b 0 b 0 b 2 b 2 b 2 b 2 b l b 2 b l b 0 b 2 b 0 

b ! b l b 0 b 0 b 0 b l b 2 b 0 b 0 b l b l b 2 


Análisis de Varianza 


F. de V 

G. de L. 

Repeticiones 

r-1 = 2 

A 

P-1 = 3 

Error (a) 

(r - l)(p -1) = 6 

Total Unidad Principal 

pr -1 - 11 

B 

q-1-2 

AxB 

(p- i)(q- i) = 6 

Error (b) 

p(r- l)(q- 1 ) = 16 

Total Subunidades 

P r (q -1) = 24 

Total 

pqr-1 = 35 
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Debido a que los niveles del factor a son comparados en tres replicaciones 
de un bloque aleatorio, el cuadrado medio de la interacción de la repetición por 
el efecto A, es el error apropiado para comparar el efecto A y se denota error (a). 
En igual forma, el error (b) se compone de las siguientes interacciones: (RxB) y 
(RxAxB), la primera es la interacción de primer orden de la repetición por el 
efecto B y la segunda es la interacción de segundo orden de la repetición por el 
efecto A y por el efecto B, este es el error apropiado para comparar la interacción 
de primer orden de los efectos (AxB) y en algunas instancias para comparar el 
efecto B. 

Los efectos de las interacciones RxB y RxAxB están confundidos y no son 
separables. Sin embargo, aritméticamente es posible separarlas, pero ambas 
interacciones son estimaciones de la misma cantidad, por lo que figuran juntas en 
la suma de cuadrados del error (b). Esta cantidad debe ser llamada Suma de 
cuadrados de RxB dentro de las parcelas principales. 

No tomando en cuenta la diferencia en grados de libertad, la eficiencia de la 
parcela dividida en relación al bloque aleatorio tomando en cuenta B y AxB es: 

r(p-l)+(p-l)(r-l)lEa+[(p-l)(q-l)+p(r-l)(q-l)]Eb _ (p-l)E a +p(q-l)Eb _E’e 
(pqr- r) (pq-l)Eb E'b 


donde: 

p = número de tratamientos de parcelas principales 
q = número de tratamientos de parcelas secundarias 
r = número de repeticiones 
E(a) = cuadrado medio del error de (a) 

E(b) = cuadrado medio del error de (b) 

La eficiencia en los efectos A o las comparaciones de parcelas principales 
puede ser obtenida mediante la fórmula: 

E'e 
Ea 
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Partición de los Grados de Libertad para el Diseño 

Parcelas Divididas con diferentes arreglos de unidades experimentales 

En las Tablas 11.1,11.2, y 11.3 se muestran los esquemas de ANAVAR para 
diferentes arreglos de unidades experimentales. 

Tabla 11.1. Esquema de ANAVAR para un Diseño en Parcelas divididas en un 
diseño completamente aleatorizado con r repeticiones. 

F. de V 

G. de L. 

A 

P ' 1 

Error (a) 

p(r- 1) 

Total Unidad Principal 

pr-1 

B 

q- 1 

AB 

(p - l)(q -1) 

Error (b) 

p(r-l)(q-l) 

Total Subunidades 

p r (q - 1) 

Total 

pqr- 1 

Tabla 11.2. Esquema de ANAVAR para un Diseño en Parcelas divididas en un 

diseño en bloques aleatorios con r bloques completos. 

F.deV 

G. de L. 

Repeticiones 

r- 1 

A 

P - 1 

Error (a) 

(r-l)(p-l) 

Total Unidad Principal 

pr-1 

B 

q- 1 

AxB 

(p ■ i)(q ■ i) 

Error (b) 

p(r- l)(q- 1) 

Total Subunidades 

p r (q -1) 

Total 

pqr - 1 
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Tabla 11.3. Esquema de ANAVARpara un Diseño en Parcelas divididas en un diseño 
cuadrado latino con p = lado del cuadrado 

F.deV 

G. de L. 

Hileras 

P ' 1 

Columnas 

P ' 1 

A 

P - 1 

Error (a) 

(p-l)(p-2) 

Total Unidad Principal 

P 2 -l 

B 

q- 1 

AB 

(p - !)(q - !) 

Error (b) 

p(p - i)(q -1) 

Total Subunidades 

p 2 (q - i) 

Total 

p 2 q ■ i 


E(a) es generalmente mayor que E(b); esto es debido a que las observaciones 
en subunidades de la misma unidad principal tienden a ser positivamente 
correlacionadas y en esta forma reaccionan en forma más parecida que las 
subunidades principales diferentes. En caso de ocurrir que E(a) sea menor que 
E(b) lo propio es considerar a E(a) y E(b) como estimaciones de la misma varianza 
& y consecuentemente las sumas de cuadrados deben sumarse y dividirse por los 
grados de libertad a fin de obtener una estimación de o 2 . En caso de que E(a) sea 
significativamente mayor que E(b) debería ser considerado seriamente la difícil 
posibilidad de una correlación intraclase negativa. 
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Las desviaciones estándar o errores estándar apropiados para las 
comparaciones entre diferentes medias son: 


Dos medias de A a. -a. 

> j 

Dos medias de B b. -b 

i j 

Dos medias de B al 

mismo nivel de A a. b.-a b, 

Dos medias de A 

al mismo nivel de B a- b- -a, b. 

Dos medias de A 

a diferentes niveles de B a. b. -a. b 

i ] km 

(medias de dos tratamientos) 



Las comparaciones de dos medias de A al mismo o diferentes niveles de B, 
involucra tanto el efecto principal de A como la interacción AB, lo cual significa 
que ambas son comparaciones de subunidades, por lo que es apropiado usar el 
promedio ponderado de E(a) y E(b) como se observa en el cuadro anterior. 
Para tales comparaciones, la razón de la diferencia entre dos tratamientos a su 
error estándar no sigue la distribución de “t”, una aproximación sería: 

t ,_ (q-l)E(b)t(b) + E(a)t(a) 

(q- l)E(b) + E(a) 1U ) 

t(a) y t(b) son valores tabulados de t, seleccionados a los niveles de significación 
correspondientes a los grados de libertad de E(a) y E(b). t' corresponderá a un 
t tabulado y caerá entre t(a) y t(b). 

Existen muchas variantes del diseño parcelas divididas, estas variantes 
comprenden por ejemplo, divisiones de las subunidades debido a la inclusión de 
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un tercer factor C a u niveles, lo cual conduce a la partición de los grados de 
libertad de acuerdo a las subunidades o unidades terciarias; el esquema del añadido 
al análisis de la varianza para dicho factor sería: 

F.deV 

G. deL. 

C 

u- 1 

AC 

(P - l)(u - 1) 

BC 

(q - i)(u -1) 

ABC 

(p - l)(q - l)(u - 1) 

Error (c) 

pq( u - l)(r -1) 

Unidades Terciarias 

pqr(u-l) 

Total 

pqru - 1 


Modelo Matemático y Esperanza de los Cuadrados Medios 

Modelo Lineal Aditivo 


Y ijk =V + Pi + cc j +S ¡j+ (3 k + (ccp) jk + (11.4) 

donde: 

// = efecto de la media general. 
p t = efecto de la repetición i-ésima. 

OCj = efecto del j-ésimo nivel del factor A 

S¡j = componente aleatorio del error asociado con el j-ésimo tratamiento 
de la parcela principal en la repetición i-ésima. 

P k — efecto del k-ésimo nivel del factor B. 

(oc/3) jk = efecto de la interacción del nivel i-ésimo del factor A con el 
nivel k-ésimo del factor B. 

£ ¡jk = componente aleatorio del error asociado con el tratamiento k- 
ésimo en la repetición i-ésima en la ubicación j-ésima. 
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El modelo puede ser de efectos fijos, aleatorios o mixtos de acuerdo con lo 
visto en la unidad sobre análisis de la varianza y visto en diseños anteriores. 

A continuación (Tabla 11.4) se dan las esperanzas matemáticas de los 
cuadrados medios para parcelas divididas en bloques aleatorios, esto es básico 
para entender cual es el error apropiado para realizar validamente la prueba F. E 
igualmente las Tablas 11.5 y 11.6 muestran los esquemas de ANAVAR para parcelas 
divididas en bloques aleatorios y en cuadrado latino respectivamente. 
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Tabla 11.4 Valores promedios de los Cuadros Medios para un modelo de parcelas dividiodas en un diseño en bloques aleatorios 
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Cont. Tabla 11.4 
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Tabla 11.5. Esquema de 

análisis de varianza de parcelas divididas en 

bloques aleatorios 

F. de V. 

G. de L. 

Suma de Cuadrados 

CM 

Repeticiones 

r-1 

r y 2 

¿ — -F.C. 

SCBIoq/(r- 1 ) 



tí pq 


A 

p-1 

p q y 2 

Él _--F.C. 

títí r q 

SCA/(p- 1) 



Eyí 


Error(a) 

(r- 1 Kp - 1) 

u F.C. SC(R)-SC(A) 

q 

SCF.(a)/(r-l)(p- 1) 

Unidades 


IX 


Principales 

pr- 1 

,J F.C. 




q 


B 

q-l 

q v 2 

y^-F.c. 

£ rp 

SCB/(q- 1) 

AB 

(p-IHq-l) 

p q Y 2 

y, y — -F.C.-SCA-SCB 

SCAH/(p-IXq-l) 



j=l k=l 1 


Em>r(b) 

P<r- iKq-1) 

SCTotal -SCUnidades Principales - SCB - 
SCAB 

SCF.(b)/p(r *1 Xq - 1) 

Total 

pqr- 1 

tíi c- k - F - c - 

i = l j = l k = l 




F.C. = (GranTotal ) 2 /pqr 
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Tabla 11.6. Esquema de análisis de varianza de parcelas divididas en cuadrado latino 
Parcelas Principales en Cuadrado latino 


F. de V. 

G. de L. 

Suma de Cuadrados 

CM 

A 

P- 1 

r Y 2 

Z --FC. 

SCA /(p -1) 

Columnas(C) 

P- 1 

ti P 

r y 2 

S --F-C. 

SC(C)/(p-1) 

Hileras (H) 

p- 1 

ti P 

r y 2 

É ~ - F.C. 

SC(H)/(p- 1) 

Error(a) 

(P-1XP-2) 

ti P 

£ Yj k -F.C.-SC(A)-SC(C)-SC(H) 

¡j.k 

SCE(ay(r-lXp-l) 

Parcelas 

Principales 

p’-l 

K-f-c. 

ij.k 


B 

q-1 

SY 2 m 

SCB/(q-l) 

AB 

(MXq-l) 

m p C 

p 2 

SCAB/(p -lXq *1) 

Error(b) 

p(q- >Xp-1) 

-^2-F.C.-SCA-SCB 

P 

SCTotal -SCParcelas Principales - SCB - SCAB 

SCE(b)/p{q -l)(p - 1) 

Toial 

p'q -1 

X4.-F-C. 



237 


Dr. Franklin Chacin 


Ejemplo Ilustrativo 

El siguiente ejemplo está basado en las pruebas de germinación, en los que 
a semillas de ocho variedades les fueron aplicadas los siguientes cuatro tratamientos: 

Semilla 

b fl trillada y no tratada con lupodorito de sodio 
bj no trillada y no tratada con lupodorito de sodio 
b 2 no trillada y tratada con lupodorito de sodio 
b 3 trillada y tratada con lupodorito de sodio 

Se utilizaron tres repeticiones. Los resultados obtenidos por repeticiones y 
combinación fueron los dados en la Tabla 11.8. 


Tabla 11.8. Datos en el ejemplo ilustrativo en parcelas divididas en un diseño en 
bloques aleatorios. 


Total 


REPETICION I 


a o b i 

a 2 b 3 

a 3 b 0 

a 5 b 9 

12 

10 

52 

28 

a 0 b 2 

a 2 b 0 

a 3 b 3 

a 5 b 3 

13 

51 

13 

14 

cF 

en 

o 

a 2 b l 

a 3 b 2 

a 5 b l 

66 

8 

19 

8 

a 0 b 3 

a 2 b 2 

a 3 b l 

a 5 b 0 

6 

20 

4 

59 

97 

89 

88 

109 


a 4 b 2 

a i b i 

a 7 b 3 

a s b i 

9 

26 

9 

12 

a 4 b 3 

a i b 2 


a 6 b l 

12 

27 

14 

26 

a 4 b 0 

a i b o 

h h 2 

a 6 b 3 

45 

77 

30 

15 

a 4 b l 

a i b 3 

a 7 b 0 

a 6 b 0 

20 

15 

49 

56 

86 

145 

102 

109 


825 
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REPETICION II 


a 3 b 2 

a 6 b 0 

a 7 b 3 

a 4 b t 

a 0 b 3 

a i b 2 

a 5 b i 

a 2 b i 

16 

38 

15 

13 

12 

5 

8 

16 

a 3 b l 

a 6 b 2 

^3 

a 4 b 3 

a o b o 

a i b o 

a 5 b 2 

a 2 b 2 

15 

16 

41 

12 

63 

47 

32 

30 

a 3 b 3 

a 6 b l 

®7 b 2 

a 4 b 0 

a 0 b 2 

a i b i 

a 5 b 3 

a 2 b O 

9 

16 

28 

51 

13 

11 

21 

81 

a 3 b 0 

a 6 b 3 

a 7 b i 

a 4 b 2 

a o b i 

a i b 3 

a 5 b O 

a 2 b 3 

40 

8 

20 

10 

10 

4 

66 

14 

80 

78 

104 

86 

98 

67 

127 

141 


REPETICION III 


a 6 b 3 

a 7 t>. 

a 5 b 0 

a 4 b 2 

S b 2 

a 2 b 2 

a o b i 

a Á 

7 

36 

49 

12 

7 

29 

13 

18 

a 6 b 2 

a 7 b l 

a 5 b 2 

a 4 b 0 

a 3 b 0 

a 2 b l 

a 0 b 3 

a i b o 

24 

25 

29 

52 

59 

14 

7 

66 

a 6 b l 


a 5 b 3 

a 4 b , 

a 3 b l 

a 2 b 3 

a o b o 

a i b 2 

16 

54 

16 

16 

11 

10 

70 

11 

cr 

o 

a 7 b 3 

a 5 b l 

a 4 b 3 

a 3 b 3 

a 2 b 0 

a 2 b 0 

a i b 3 

45 

12 

8 

11 

7 

63 

11 

15 

92 

127 

102 

91 

84 

116 

101 

110 823 
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TOTALES PARA VARIEDADES Y TRATAMIENTOS 


Trata¬ 

mientos 




VARIEDADES 



Total 


a o 

a i 

*2 

a 3 

a 4 

a 5 

a e 

h 



199 

190 

195 

151 

148 

174 

139 

144 

1340 

K 

35 

55 

38 

30 

49 

24 

44 

59 

334 

b 2 

37 

43 

79 

42 

31 

89 

66 

94 

481 

b 3 

25 

34 

34 

29 

35 

51 

30 

36 

274 

Total 

296 

322 

346 

252 

263 

338 

279 

333 

2429 


Factor de Corrección: 


F.C.= 


Zv _ 2429 2 

pqr (8)(3)(4) 


= 61458,76 (un grado de libertad) 


Suma de Cuadrados 
Suma de Cuadrados Totales 

SCT = 12 2 +10 2 +....+15 2 - F.C.= 36736,24 (95 grados de libertad) 

Suma de Cuadrados de Repeticiones 

825 2 +781 2 +823 2 , .. 

SCR =-- F.C.= 38,58 (2 grados de libertad) 

8x4 

Suma de Cuadrados de Variedades 
29^2 _j_322^+ +333 2 

SCA =-—-- F.C.= 763,16 (7 grados de libertad) 

4x3 
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Suma de Cuadrados de E(a) 
97 2 + 89 2 +...+101 2 +110 2 


- - F.C-38,58- 763,16 = 1377,25 (14 grados de libertad) 


Suma de cuadrados tratamientos de semillas 
1340 2 +334 2 +481 2 +274 2 

SCB =-- F.C = 30774,28 (3 grados de libertad) 

3x8 

Suma de Cuadrados A x B 

199 2 +190 2 +...+30 2 + 36 2 


SCAB = - 


-F.C.-763,16-30774,28 = 2620,13 (21 g. del.) 


Suma de Cuadrados de Error(b) 


SCE(b) = 36736,24 - 38,58 - 763,16 - 1377,25 - 30774,28 - 2620 = 1162,84 

Análisis de Varianza 

Vease Tabla 11.9 a continuación. 


Tabla 11.9. Esquema de análisis de varianza de parcelas divididas en bloques 
aleatorios 


F.deV. 

G.deL. 

Suma de Cuadrados 

CM 

Repeticiones 

r-l=2 

38,58 

19,29 

A 

P-l-7 

763,16 

109,02 

Error(a) 

Unidades 

(r- l)(p-1) = 14 

1377,25 

98,38 

Principales 

23 



B 

q-l=3 

30774,28 

10258,09 

AB 

(p-l)(q-l)=21 

2620,13 

124,77 

Error(b) 

Parcelas 

p(r-l)(q-l)-48 

1377,25 

24,33 

secundarias 

72 

36736,24 


Total 

pqr-1=95 

36736,24 
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DISCUSION 


Si se asume que el efecto variedad es un efecto fijo, porque son las únicas 
variedades de interés al investigador (modelo I) el error(a) es el término correcto 
para hacer la comparación. 


F = 


109,02 

98,33 

98,38 


= 1,11 (n.s.) 


F(7,14,0.05) = 3,39 
F(7,14,0.01) = 4,78 


La selección de la varianza del Error Experimental para comparar la varianza 
entre las medias de la germinación para los cuatro tratamientos de las semillas 
depende de la hipótesis planteada. Si las ocho variedades constituyen una muestra 
aleatoria de una población de variedades y si un tratamiento de semilla va a ser 
recomendado para todas las variedades, el cuadrado medio de la interacción 
AxB es el error apropiado (modelo II) 


10258,09 

F = -— = 82,2** F(3,21,0.01) = 4,87 

124,77 ^ ' 

Si las ocho variedades representan solamente las variedades de interés y si el 
tratamiento de semilla recomendado es para las ocho variedades, entonces el 
CME(b) es el error adecuado para comparar dichas medias (modelo I). 

Una tercera situación puede presentarse si se asume que las ocho variedades 
constituyen una muestra aleatoria de variedades, pero los diferentes tratamientos 
de semilla serán recomendados por variedad, ya que se plantea la interacción 
variedad por semilla. En este caso el CME(b) es el correcto denominador para 
la prueba de F. 

Casos más complejos de parcelas divididas son utilizados por la 
experimentación agrícola, como son las parcelas divididas en el tiempo o en el 
espacio. 
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Existe además como caso de experimentos factoriales con efectos principales 
confundidos, el diseño de bloques divididos, subdivididos, otras subdivisiones y 
variaciones para lo cual se recomienda consultar las referencias. 

DISEÑO EN FRANJAS O DISEÑO EN BLOQUES DIVIDIDOS 

Introducción 

Es una variante del diseño parcelas divididas, por cuanto la repetición del 
bloque completo, es dividido en forma reticular en parcelas o franjas en sentido 
vertical y horizontal, cuya ubicación en un eje de coordenadas semejarían dos 
bloques al azar superpuestos y en la intersección de ambas franjas quedan la 
subunidad con el tratamiento respectivo. 

Combinación de los niveles de los factores 

Ejemplo: 

a o 

A a x B 

a 2 

S 


b 0 

b, 

b 2 


Tratamientos: 
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Aleatorización: 

En cada repetición o bloque completo, se aleatoriza cada nivel de A en 
franjas o parcelas en el sentido del eje de las Y. Cada nivel de B es aleatorizado en 
franjas o parcelas en el sentido del eje de las X. En un diseño en franja con tres 
repeticiones se tendría por ejemplo el siguiente esquema. 


REPETICION I 


a o b o 


REPETICION II 


a, a„ 


a o b o 


REPETICION DI 


a o b o 
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Modelo Matemático y Esperanzas de los Cuadrados Medios 

Modelo Lineal Aditivo 


Y ¡Jk =M+ a, + A + 4 + Pj + 7 jk + AA, + 01- 7 ) 


donde: 
i= 1,..., a 

j= l,-,b 

k— 1,..., r 


Vea la Tabla 11.10 para establecer las Experanzas de los Cuadrados medios 
y la Tabla 11.11 para el ANAVAR correspondiente a este diseño. 
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Tabla 11.10 Valores promedios de los Cuadrados Medios para un modelo de parcelas en franja. 
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x 

C3 

+ 


+ 


b 

X 

u. 

+ 

o- 

b 

t— 
+ 
r < 

b 

X 

+ 

Cl 

b 



+ 


b 


r < 

b 

c3 


+ 



¡_ 


+ 

b 


_o 

o 

”3 

C 

S 

i 

u 

UJ 


n 

b 

X 

rt 

+ 

b 

+ 

r < ^ 

b 



5 

X 

u. 

+ 

fN 'O 

b 

JO 

+ 

C'l ty 

b 



Xi 

+ 

b 



C3 

J— 

+ 


b 



C3 

+ 


r» 

b 


CN ^ 

b 


O. 

c¿ 


< 


CQ 


o 

t: 

LU 


cc 


c 

u 

LÜ 
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Continuación de la Tabla 11.10 
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Tabla II. II- ESQUEMA DE ASAUSIS DE l'ARIAXZA DE FAHCEUAS DI HUIDAS EX BLOQUES ALEA TORIOS 


F. de V. 

(i. de I- 

Suma de Cuadrados 

CM 

Repeticiones 

r-1 

r Y 2 

y 

á ab 

SCBIoq/(r-l) 

A 

a-l 

J Y 2 

y-^-F.c. 

á rb 

SCA-(a-l) 



S Y - 


Error(a) 

(a- 1 )(r - 1) 

-F.C.- SC(R) - SC(A 

b 

SC!'( a}/(a-1K r - 1) 

Unidades 

Principales 

ra- 1 

,k F.C. 

b 

SCKWU-UU- 1) 

t i 

b-1 

b V- 

t-^-F.c. 

H ra 

SCB'(b-l ) 

I:rror(b> 

(r-lXb-l) 

Y 2 

y - F.C. - SC(R) - SCB 

SCU(b)/(b-l )(r - 1) 



\Í a 


AU 

(a-lKb-l) 

yy — - F.C. - SC A- SCI 

i=i j-i r 

SCAB/(a-l)(b-l) 

Rrroric) 

(r -IKa-D(b-l) 

Por diferencia 

SCF.tcXtr • 1 )(a-1 )(b-1) 

Total 

rab - 1 

tlí Y¿-F.C. 

¡ = l j=l k = l 




F.C. = (GranTotal)' /pqr 
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Ejemplo Ilustrativo 

Probándose el efecto de cuatro variedades de soya (A) y tres épocas de 
siembra (B) y utilizándose como plan experimental parcelas en franjas los 
rendimientos en Kilogramos por parcela fueron los siguientes: 


a l 

a 2 

a 3 

A 

Y * 

a , 

a 2 

a 3 

a 4 


2.4 

2.1 

22 

2.0 

8.7 

2.0 

1.9 

2.2 

2.1 

82 

2.7 

2.6 

2.7 

2.8 

10.8 

2.6 

2.5 

2.5 

2.4 

10.0 

1.6 

1.5 

1.4 

1.7 

62 

12 

13 

12 

1.1 

4.8 

6.7 

62 

63 

6.5 

25.7 

5.8 

5.7 

5.9 

5.6 

23.0 


Repetición I 




Repetición II 



a , 

a 2 

a 3 

A 

Y 

4.4 

4.0 

4.4 

4.1 

16.9 

53 

5.1 

52 

5.2 

20.8 

2.8 

2.8 

2.6 

2.8 

11.0 

12.5 

11.9 

12.2 

12.1 



Ambas Repeticiones Y.. =48.7 


Cálculos 


Factor de Corrección: F.C.= 


48,7 2 

rab "(2)(4)(3) 


= 98,82 


Suma de Cuadrados 


Suma de Cuadrados Totales 


SCT = 2,4 2 + 2,l 2 +....+ l,l 2 - F.C.= 105,51 -98,82 = 6,69 


Suma de Cuadrados de Repeticiones 


SCR = 


25,7 2 +23,0 2 
4x3 


F.C.= 99,12 -98,82 = 0,30 
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Suma de Cuadrados de Variedades 


12,5 2 + 11,9 2 + 12,2 2 +12,l 2 

SCA = — - - ’ ’ -— 

2x3 

Suma de Cuadrados de E(a) 

6,7 2 +6,2 2 +...+5,9 2 +5,6 2 


— F.C.= 98,85 -98,82 = 0,03 


98,82 - 0,03 - 0,30 = 99,19 - 98,82 - 0,03 - 0,30 = 0,04 


Suma de cuadrados de épocas de siembra 

16,9' 2 + 20,8 2 + 11,0 2 

SCB = —-’-— - F. C = 104,91 - 98,82 = 6,09 

2x4 

Suma de Cuadrados de Error (b) 


SCE(b) = 


8,7 2 +...+4,8 2 


- F.C.-SCR- SCB = 105,26 - 98,82 - 0,30 - 6,09 = 0,35 


Suma de Cuadrados A x B 


4,4 2 +...+2,8 2 

SCAB = —-— - F. C.-SCA - SCB = 105,00 - 98,82 - 0,03 - 6,09 = 0,06 


Suma de Cuadrados de Error(c) 


SCE(c) = 6,69 - (99,19 - 98,82) - (105,26 - 98,82 - 0,30) - 0,06 = 6,69 - 0,37 - 6,14 - 0,06 = 0,12 


Análisis de Varianza 

Vease tabla 11.12 a continuación. 
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Tabla 11.12. Esquema de análisis de varianza de parcelas en franjas con 
dos repeticiones 

Fuente de V. 

G.deL. 

SC 

CM 

F 

Variedades (A) 

3 

0,03 

0,01 

1 ns 

Repeticiones (R) 

1 

030 

0,30 


E(a) 

3 

0,04 

0,01 


Epoca(B) 

2 

6,09 

3,045 

17 4** 

m 

2 

035 

0,175 


AxB 

6 

0,06 

0,01 

<1 ns 

E(c) 

6 

0,12 

0,02 


Total 

23 

6,69 




Se concluye que no se detectaron diferencia significativa en el término 
correspondiente a la Interacción Variedad - Epoca. Luego se verifica que tampoco 
existe efécto de variedad, pero si existen diferencias altamente significativas entre 
épocas. 
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Capítulo 12 

ANÁLISIS DE REGRESIÓN 

DEFINICION DE REGRESIÓN 

Es la relación funcional entre una variable dependiente y una o más variables 
regresoras. Puede ser lineal o no lineal e igualmente se puede categorizar en 
Regresión Simple, Regresión Parcial y Regresión Múltiple. Si existe una sola variable 
regresora la regresión es Simple, por el contrario si son varias variables regresoras, 
la regresión es Múltiple. 

La Regresión Lineal Parcial es la relación funcional entre una variable 
dependiente y una o más variables regresoras, manteniendo fija una o más variables. 

En otros casos existe Regresión Multivariada, la cual ocurre cuando hay 
varias variables dependientes (varios Y). 

MODELO DE REGRESIÓN LINEAL SIMPLE 

Sea (Y 1 ,X l ),(Y 2 ,X 2 ),(Y 3 ,X 3 ),---,(Y„,X n ) una muestra aleatoria bivariada de tamaño n 
Se plantea describir la relación fundamental entre X y Y a través del modelo 
poblacional: 

Y¡ = P 0 + P,X¡ + £¡ (12.1) 

donde Y denota la variable dependiente, X denota la variable independiente. 

Y¡ y s¡ son variables aleatorias 
P 0 y P, son parametros del modelo 
P 0 representa el intercepto 
P, representa la pendiente de la recta 
X¡ es fija o constante 
y Sj ~ n(0,g 2 ) 
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DISTRIBUCIÓN PROBABILISTICA DE Y. 

1 

Una vez seleccionada la expresión (12.1) como modelo poblacional el 
problema que se plantea es de estimación de los parámetros de ese modelo. Bajo 
el supuesto de normalidad de los errores descrito anteriormente resulta de gran 
importancia para tales fines determinar la distribución probabilística de Y. 

Po.yP., 

Esperanza Matemática de Y. 

E(Y¡) = E(P 0 + p,X¡ + s¡) 

= E(p 0 ) + E((3,Xj) + E(s¡) como P 0 y P,X i son constantes 

= p 0 + p,x¡ + 0 

= Po+P.Xi 

Varianza de Y. 

1 

V(Yj) = V(P 0 + P,X¡ + s¡) 

= V(p 0 ) + V(P,X ¡ ) + V^) como p 0 y p,Xj son constantes 
= 0 + 0 + a 2 
= a 2 
En resumen: 

e¡ ~ (0,a 2 ) 

Y¡~ (P 0 + P,X i 3 a 2 ) . (112) 

MÉTODO DE LOS MÍNIMOS CUADRADOS 

El método de los mínimos cuadrados es usado para obtener estimadores 
de P 0 y P, a partir de los datos. El método consiste en seleccionar valores de 
P o y P! tal que la suma de cuadrados de las desviaciones de las observaciones 
de la línea de regresión ,esto es, la función de regresión sea mínima. 
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Entonces se escogen |3 0 y ¡3, para minimizar: 

n n 

X =X (Yí-Po-P.Xj ) 2 

i=l i=l 


Esta expresión se puede minimizar por varios métodos, uno de los cuales 
consiste en diferenciar con respecto a P 0 y Pj , igualar a cero y resolver por 
P 0 y P, ■ Se genera entonces el siguiente sistema de ecuaciones, las cuales son 
llamadas ECUACIONES NORMALES. 


X Y ¡ =np 0 +P,X X¡ 

i-l ¡=1 

£ X,Y,=P 0 ¿ X l+ p,¿ X? 


¡=1 


i=l 


i=l 


(12.3) 


cuya solución es: P 0 = Y - p, X 


(12.4) 

SPXY 
SCX 

E inclusive, por métodos matriciales se podría realizar de la siguiente manera: 


(3, 


2(X,-XXY,-Y) 


Z(Xi-X ) 2 
o en forma equivalente 

n Z X i Y ¡ ~Z X íZ Y í 


b,=P,=- 


n Z x Ml X i) 2 
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Y, = P 0 +P.X, +£, 

Y 2 — P 0 + PiX 2 + s 2 

Y„ = p 0 +P|X n +e n 

y en forma general 
Y = Xp + £ 


eslo es 



s = Y-Xp_ 

e'e = (Y-XP)'(Y-Xp) = Y'Y-2p’X'Y + p'X'Xp 
£ 

-= -2X'Y + 2X'Xp = 0 

5p 

luego 

X'Xp-X'Y 

P = (X'X) -1 (X'Y) (12 .5) 
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íl 1 • 

•• r. 

f 1 

1 

x ’l 

X 2 


( n \ 

11 X X, 

i=l 

vX, x 2 • 

•• x n J 

vi 

xj 


n n 

,X X 1 X xf 

V i=I i=l 7 


(X'XT 1 - 


f n n 

X x? -x x, 

i=l i = l 

.-X X, n 

V i=l _* 

n X xf -( ¿X ,) 2 

Y 


(X'Y) 


1 1 

U, X 2 


i 

Xj 


Y, 




( n 


P = 


Po = b o 

Pl =b I. 


X x? -X x, 


v 


i=l 


V -Xx, 

V i=] 


¡=1 


n 


Xy, 


1=1 


a§ X ‘ Y V 


n X xf -( Xx ,) 2 


i=l 


i=t 


( 12 . 6 ) 


Resolviendo la operación planteada en forma matricial se obtendrá las mismas 
estimaciones de b y b. anteriores. 

O * 1 
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DISTRIBUCIÓN PROBABILISTICA DE p t 

Esperanza de (p [ )= bj 


b,= 


E(X i -X)(Y ¡ -Y) 

Z(X,-X) 2 


E(b , )= JlMTDo} =E {S(x,-x)Y, 


ZcXi-x ) 2 

(X,-X) 


Z(X¡ -X) 2 


Supongamos C¡ - __ )2 

E(b>) = EiZCiY.) = E(C,Y, + C 2 Y 2 +-+C n Y n ) 


E(b,) = E(C,Y 1 +C 2 Y 2 +-+C n Y n ) 

E(b,)= C 1 E(Y 1 ) + C 2 E(Y 2 )+-+C n E(Y n ) 

E (b,) = C¡(P 0 +P,X 1 ) + C 2 (P 0 + p 1 X 2 )+'--+C n (P 0 +p,X n ) 

E(b,) = P 0 ¿C, + P.XCjX, EC, = j (X ‘~ X) , = 0 


i=l 


E(x¡-x) 


E(b 1 ) = p,Zc i X i 


i=l 


_ , „ ^ Z(X,-X)„ „ Z(X¡ -X)(X¡ -X) 

E(b 1 ) = PiE^7T—=^Xj =p, 


. „ I(X, -X) 2 _ 
E(b,) Pi -r-i — 2 Pi 
EíXi-X) 


Z(X,-X) 


E(b,) = P, 


P, ES UN ESTIMADOR INSESGADO 
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Varianza de p | 


V(b 1 ) = V(Xc i Y ¡ ) 

i=! 

V(bj) = V(C 1 Y 1 +C 2 Y 2 +-+C n Y n ) 

V(b,) = CJ V(Y, ) + C 2 V(Y 2 )+• • -+C 2 V(Y n ) 
V(bj) = C 2 cr 2 +C 2 c? 2 +---+C^a 2 


V(b,)-XcfcT 2 

i=l 


V(b 1 ) = 


Z(Xi-X ) 2 


xy 2 Z(X,-X ) 2 
L 1 "EíXi-X ) 4 


o 2 Varianza de las Y¡ 
a 2 x Varianza de las X 


DISTRIBUCIÓN PROBABILISTICA DE R (b ) 

a rO' q / 

Esperanza dep o 

b 0 = Y - b,X 

E(b 0 ) = E(Y - b,X) = E(Y) - E(b,X) 

y y¡ _ 

E(b 0 ) = E(^-)-XE(b,) 


E(b 0 ) - E( Y ‘ +Y ^ ’ +Yn) - xp, 
n 

E(b ) _ (Po + p 1 x 1 ) + (p 0 +p,x 2 )+-+(p n + p,x„) 

n Pl 

n P 0 +p,yx¡ _ 

E(b„)= Pl ^ ‘ -Xp, 
n 

E(b 0 ) = p 0 + Xp, - Xp, 


E(b 0 ) = P 0 => P„ ES UN ESTIMADOR INSESGADO 


309 



Pr. Franklin Chacin 


Varianzade p (| 


V(b 0 ) = V(Y - b,X) = V(Y) + X 2 V(b,) 


V(b 0 ) = 


V(Y,) + V(Y 2 ) + -V(Y n ) —, a' 


- + X/ 


na“ —, a 
-+ X 2 — 


V(b 0 )= r2 


V(b 0 ) = cr 2 (—+ 


X 2 


n X( x i- x ) 


-) 


DISTRIBUCIÓN PROBABILISTICA DE y 


Esperanza de y 

Y = b 0 +b,X i 
E(Y) = E(b 0 ) + X¡E(b,) 
E(Y) = P 0 +P 1 X I 
E(Y) = Z(Y i ) 

Varianzade y 


V(Y) = V(b 0 ) + X 2 V(b,) 

, 1 X 2 2 a 2 
V(Y) = a 2 (— + ~) + X 2 —y 
n CT x CT x 

, 1 X 2 +X 2 

V(Y) = cr 2 (—+- 

n ct x 

2 1 (X¡-X) 2 % 

V(Y) = a 2 ( r+ ^,¿ 4 , ) 


n ^(Xi-X ) 2 
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En resumen: 


Yj ~ (P 0 +P,X¡,a 2 ) 


b,«(P„ 


c“ 


Z(x,-x) 


-) 


1 


X 2 


b 0 «(P 0 ,C (—+ -=ry)) 

o vpo» K n ^](x.-X ) 2 


Y¡ ~ (¡3 0 + ¡3 1 X ¡ ,a (—+ 


1 X 2 +X 2 


n Z(X,-X) 


=“r)) 


PRUEBAS DE HIPÓTESIS 

I 

Las estimaciones anteriormente realizadas permiten obtener a partir de 
los datos, un modelo de estimación de la forma: 

Y = b 0 + b,X¡ 

conviene indagar sobre lo adecuado de ese modelo estimado para describir la 
relación entre Y y X. Además, conocida la distribución probalística de los errores, 
P 0 y (3, es posible plantear Pruebas de Hipótesis para verificar la adecuación del 
modelo. 


Pruebas de Hipótesis para ¡3, 

En este caso se plantean las siguientes hipótesis nula y alternativa, 
respectivamente; 


Ho:p, = 0 
Ha:p, *0 
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El estadístico de prueba correspondiente es el siguiente: 



Si t c > t ub (a,n-2) SerechazaHo. 


En este caso el rechazo de la hipótesis nula indicaría la existencia de una 
relación lineal entre las variables. 

Pruebas de Hipótesis para p 0 

Las hipótesis planteadas serían: 

Ho:p 0 =0 
Ha:p 0 # 0 

el estadístico de prueba: 

= bp-pp = _bp b 0 

c o c 

& b 0 a b ( 

Si t c > t teb (a, n - 2) Se rechaza Ho. 

el rechazo de la hipótesis nula indicaría que el intercepto tiene un valor diferente 
a cero. 



3/2 
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Intervalos de Confianza 

Otra forma equivalente para establecer inferencias estadísticas para el modelo 
lineal simple es a través de intervalos de confianza. Se construye un intervalo de 
confianza del 100(1 -a)% para p,. Si este intervalo no incluye el valor cero, entonces 
es razonable concluir que p, es diferente de cero, y que Y y X están en algún grado 
relacionados en forma lineal. Similarmente se concluye con respecto a p en 
relación a que si el intervalo de confianza incluye el cero es indicativo de que el 
intercepto es el origen de coordenadas y esta conclusión se sostiene con 100(l-a)% 
de confianza. 


Intervalo de Confianza para (1, 


b i-t« s b <p,<bi+t a s b 


Y "- 2 


Y"' 2 


= 1 - a 


Intervalo de Confianza para |3 0 


b 0-ta S bo ^P 0 ^ b O+t a S b 


—,n-2 


2’ n 2 


= 1 - a 


Intervalo de Confianza para y 


Y : -t 


-,n-2 


s Y < Y < Y +1 


O ,°Y¡ 
—,n-2 
2 


= 1 - a 
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ANÁLISIS DE LA VARIANZA 

Otra forma de probar hipótesis con referencia a P t es el Análisis de la Varianza, 
comunmente identificado por las siglas ANAVAR, el cual parte de la división de 
las sumas de cuadrados de la manera que se explicará a continuación. 


División de la Varianza 

(Y¡ - Y) = (Y¡ -Y¡) + (Y¡ - Y) 

Z(Y, - Y) 2 = X(Y¡ - Y,) 2 +E(Yi - Y) 2 
SCTOTAL = SCRESIDUAL + SCREGRESION 


ANAVAR 


F.deV. 

G.deL. 

S.C. 

C.M. F 

Regresión 

1 

I (Y,-Y) 1 

SCREG/1 Fc-CMRF.G/'CMRES 

Residual 

n-2 

SCT-SCREG 

SCRES/(n-2) 

Total 

n-l 

Z(Yi-Y) 2 



Las hipótesis aquí planteadas son: 

Ho : (3, - 0 
Ha: (3, *0 

Si Fe > Ft (1, n-2, a) se rechaza Ho. Esta es la misma hipótesis que se probó 
anteriormente usando el estadístico t de Student. 
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EN FORMA MATRICIAL 


Y = X§ + 8 

Y = Xp 

P = (X'X)-'(X'Y) donde Y~(Xp,a 2 I) (0 ,g 2 I) 

E(P) = e[ (X'X)-'(X'Y) ] = (X'X)-‘X'E(Y) 

E(p) = (X'X)-‘X'(Xp) 

E(p)-(X'X)-’(X'X)p =ip 

E(P) = IP 


Se usa un procedimiento similar para el caso de la varianza. 
V(P) = V[X' X)- 1 (X' Y)] = (X' X)- 1 X' V(Y) 

V(P) = (X'X) 'X'a 2 I donde (X'X) ’X'es una forma cuadrática 

V(p) = a 2 

donde C^a 2 = V(b 0 ) 

C„a 2 =V(b,) 

C 10 = C 0I = 0 para que b[ yb 0 sean independientes 
Se conoce que: 

^ n n ^ 

E x? -I x, 

i=l i=l 

-¿X i n 

(X'Xr^Mr-;-- 

n Z X 2 -( E X,) 2 

i=l i=l 

Ortogonalizando, se obtiene una matriz de la forma: 


'“'01 

C u. 


donde 


es la Matriz Varianza - Covarianza 
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V(P) = a : 


1 

— + 


X 2 


n Z(X;-X 2 ) 


S(X;-X ) 2 


V(b 0 ) O 
0 V(b,) 


Obteniéndose de esta forma las mismas estimaciones de y V(b t ) 
anteriores. 


En resumen: 

m=v 

V(P)=(XX)''cr 
E(^) = E(XP)=XP 

V( Y) = V(Xp) = X* V(p) = X (X'X) 1 Xa 2 X* es una forma cuadrática de X 

Por ende, 

V(Y U ) = X u (X'X) -1 X ii a 2 esto es, en cada u fila hay una estimación 


En forma similar se puede construir una tabla que resuma el Análisis de la 
Varianza en una Regresión Lineal Simple, en forma matricial. 


F.deV 

G. de L. 

s.c. 

Regresión 

1 

pX'Y-nY 2 

Residual 

n - 2 

Y'Y-pX'Y 

Total 

n - 1 

Y'Y-nY 2 


CMREG BX'Y-nY 2 

Donde Fe = ~ =--- 

CMRES Y'Y-(3X'Y 

Si Fe > Ftab( 1, n - 2) Se rechaza Ho —» Si Hay Regresión Lineal Simple. 
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BONDAD DE AJUSTE 

Se puede calcular por varios estadísticos: 

1.- Coeficiente de Correlación 

ZíXj-XXY.-Y) 

VZ^-XXXCY.-Y) 2 
2.- Coeficiente de determinación 

R 2 = r 2 

r2 = SCREG _ pX'Y-nY 2 
SCTOTAL _ Y'Y-nY 2 
Ademas 

p2 _SCTOTAL-SCE SCE 

SCTOTAL ~ ~~SCTOTAL 

Los valores que toma están siempre en un intervalo < R 2 < 1 ya que 0 <SCE < 
SCTotal. De manera ideal se desea tener un R 2 = 1, en cuyo caso SCE = Oytoda 
la variación presente en las observaciones puede explicarse por la presencia lineal 
de X en la ecuación de regresión. De manera que, entre más cercano se encuentre 
R 2 a uno, mayor es el grado de asociación lineal que existe entre X e Y. 

Si se designa la suma de Productos cruzados como SP XY y las varianzas 
deX e Y respectivamente como s 2 x y s 2 Y entonces se tiene: 

, SP XY 2 b,SP XY SCREG 

R" <= , , = - , Y =-xlOO 

s x s y s y SCTOTAL 

R 2 mide el porcentaje de variabilidad total de Y que es explicada por la 
regresión. 
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DETERMINACION DEL MODELO 

El modelo: Y¡ = (3 0 + P,X¡ + S¡ , cuando hay repeticiones en cada 
punto, puede escribirse de la siguiente manera: 

Y¡ = P 0 + P|X¡ + e¡ + Falta de Ajuste 
Haciendo una división de los errores, se obtiene: 

(Yy - Y..) = (Yy - Y¡.) + (Yj.--Y,.) 

ÍÉof«-v..)’= ttv,-X) 1 +¿Íñ-Y-y 

¡=I j=l i=l j=l 1=1 j=l 

ERROR TOTAL = ERROR + ERROR 

EXPERIMENTAL DEL TRATAMIENTO 

Pero si se está interesado en (Yy — Y¡) se puede realizar la siguiente 
subdivisión: 

(Yy - Y, .+Y. .-Y,) 2 = (Yy -'Y,.) 2 + (Y,.-Y,) 2 

ZÉ(Y lj -Y,.) 2 =E¿(Y ij -Y,.) 2 +É¿(Y;--Y l ) 2 

i=l j=l i=l j=l i=l j=l 

RESIDUAL = FALTA DE AJUSTE + ERROR PURO 

O ERROR 
EXPERIMENTAL 

r 

como ^ constante = r. constante 

j=i 

ZÉ( Y, - Y,.) 2 = ¿¿(Yy -%) 2 + r É(Y¡.-Y¡) 2 

i=l j=1 i=l j=l i=l 
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Si existe diferente número de repeticiones en cada punto se tiene PARA 
CADAPUNTO: 


n r l 


n r, 


II(y, -Y,.)‘ =IS(Y„ - y,.) 1 +ES(Y,.-Y i ) 1 

i=l j=l ¡=1 j=l i=l j=l 

Por ejemplo; sean los siguientes puntos: 


Y u 

x, 

y 12 

x. 

Y,3 

X, 

y 21 

X, 

Y^ 

X, 

y 23 

X, 


SCEP, Y,.) 2 conr, -1 

j=i 

SCEP 2 =¿(Y 2j -Y 2 .) 2 conr 2 -1 

M 


SCEP„ 


I(Y„ 

j=l 


■Y n .) 2 con r¡ — 1 


SCEP, + SCEP 2 +• ■ -+SCEP n = SCEP 


grados de libertad 
grados de libertad 


grados de libertad 
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Se genera entonces el siguiente análisis de la varianza: 

ANAVAR 

F.deV. 

G. deL. 

S.C. 

C.M. F 

Regresión 

1 

IIcL-y..)» 

CMREG F, = CMREG/CMEP 

Residual: 

Falta de Ajuste 

Diferencia 

ZZC-y ,) 1 

CMFA F,=CMFA/CMEP 

Error Puro 

2(r-l) 

ZZ(Y,-Y,) ¡ 

CMEP 

Total 

n-1 

Z(Y,-Y,.)’ 



Si F es significativo, indica que existe Falta de Ajuste o Sesgo; lo cual conduce 
a afiemar que el modelo es INCORRECTO. 

Si Fj no es significativo, se realiza un POOL de los errores, y ese sería el 
denominador apropiado para realizar la prueba de hipótesis para Regresión, en 
cuyo caso F, = CMREG/CMRES. 
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EL MODELO DE REGRESIÓN LINEAL MÚLTIPLE 

En los trabajos de investigación es necesario emplear técnicas estadísticas 
que permitan interpretar los resultados y de esta forma poder llegar a conclusiones 
valederas que permitan al investigador aceptar o rechazar las hipótesis planteadas 
inicialmente e inclusive formular nuevas hipótesis, una de esas técnicas estadísticas 
de gran utilidad en los investigadores es el análisis de regresión, el cual es necesario 
cuando se quiere encontrar relaciones entre las variables o establecer ecuaciones 
de predicción. 

Mallows (1973), menciona los siguientes usos de la ecuación de regresión: 

a. - Descripción 

b. - Predicción y estimación 

c. - Extrapolación 

d. - Estimación de parámetros 

e. - Control 

f. - Construcción del modelo. 

El Análisis de Regresión requiere el cumplimiento de una serie de supuestos 
necesarios para su aplicación siendo estos de gran importancia para evitar 
conclusiones erradas. Dichos supuestos han sido ampliamente discutidos por 
muchos autores (Linares y Chacín, 1986). 

Estos supuestos serían resumidamente: 

a. - Homogeneidad de la varianza de errores 

b. - Normalidad de los errores 

c. - Independencia 

d. - Aditividad de los efectos. 

Para el estudio del cumplimiento de los supuestos y alternativas de soluciones 
se tendrá que realizar algunos análisis como serían: 


321 



Dr. Franklin Chacín 


a. - Examen de residuales 

b. - Estudios y análisis de autocorrelación 

c. - Estudio y análisis de la multicolinealidad. 

Estos procedimientos han sido ampliamente discutidos por muchos autores, 
entre ellos Linares y Chacín (1986), Chacín y Meneses (1984), y Chacin (1998). 

En la investigación agrícola cuando el investigador mide el efecto que pueda 
producir determinado tratamiento sobre algunas características particulares que 
son de su interés (rendimiento, número de frutos, grosor del tallo, diámetros de la 
copa, etc.), no descarta la posibilidad de que pueda existir alguna relación o 
asociación entre una variable dependiente y algunas variables independientes o 
regresoras que en algunos casos son controladas y en otras aleatorias o ambos 
casos. 

Por ejemplo, en un ensayo con cítricas en el que se evalúa la dosificación de 
Nitrógeno (N), Fósforo(P) y Potasio (K), se podría establecer un modelo que 
relacione al rendimiento con las variables regresoras (N, P, K), en este caso, estas 
variables regresoras son controladas pero también se podría establecer relaciones 
entre el rendimiento con número de frutos, grosor del tallo y diámetro de la 
copa, que son variables aleatorias e inclusive establecer la relación del rendimiento 
con ambos tipos de variables. El análisis de regresión permitirá estudiar esas 
relaciones con el fin de llegar a conclusiones de interés para los investigadores. 

Graybill (1961), expresa que uno de los propósitos de la ciencia es describir 
y predecir los eventos en el mundo en que vivimos y una forma es mediante 
modelos que relacionen cualidades del mundo real. Chacín y Meneses (1984) y 
Cobo (1976), señalan algunas ideas expresadas por Bunge, Kempthorne, Federer, 
Gilí, Fisher, Neter y Graybill. Una relación funcional entre grupos de eventos en 
el mundo real es un modelo y aunque la relación no sea exacta sino aproximada 
es invalorable la predicción, por consiguiente cuando se dice que una relación 
funcional existe entre un grupo de variables es en forma muy aproximada. 

La función del modelo es simular el comportamiento de un sistema bajo 
ciertas condiciones. La simulación puede encontrarse mediante un modelo 
matemático que puede ser una ecuación o un sistema de ecuaciones que representan 
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cuantitativamente la hipótesis formulada en relación al sistema bajo consideración 
y que envuelve variables aleatorias y parámetros. Si la ecuación es lineal en los 
parámetros el modelo se convierte en un modelo lineal, dentro de estos modelos, 
el modelo de regresión lineal es uno de los mas importantes. 

DESCRIPCION DE LOS DATOS Y DEL MODELO 

Los datos consisten de n observaciones sobre una variable dependiente Y y 
de p variables independientes Xj, Xj, ..., X . Las observaciones son usualmente 
presentadas de la siguiente manera: 


Observaciones Y 

x, 

X, 

X3 - 

X P 

1 

Y i 

X u 

X* 

X31 - 

X. 

P 1 

2 

y 2 

X n 


X32 - 

X. 

3 

y 3 

X 13 

Xb 

X33 - 

X, 

P 3 

n 

Y 

n 

X ,„ 

x. 

X3„ - 

x 

pn 


Las relaciones entre la variable Y con las variables X t , X 2 , X 3 , ..., X p se 
formula por el modelo lineal general de regresión de la siguiente forma: 

Y = XP +8 (12.7) 

Y — vector (nxl) de respuesta. 

X = matriz (nxp) de variables independientes 
P = vector (pxl) de constantes desconocidas 
8 = vector (nxl) aleatorio de errores supuestos. 

donde: E(e) = 0 y E(s 8 ') = a 2 I n V(e) = ¿r 

Expandiendo la expresión matricial del modelo se tiene: 

Y¡ =P 0 + Pi X i¡ + P 2 X 2i +...+P p X p¡ +e ¡ (12.8) 
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Los valores de X. son fijos para i = 1,2,3,, n 

Las constantes P 0 ,P[,...,P p son los coeficientes de regresión, los cuales 
en su expresión clásica son interpretados como el incremento en la variable Y que 
se corresponde a una unidad de incremento en X. cuando las otras variables se 
mantienen constantes. 


Los coeficientes P ¡ son estimados haciendo mínimo la suma de cuadrados 
de residuales, lo cual es conocido como el método de los mínimos cuadrados. 
Formalmente, el método consiste en minimizar la expresión: 

¿sf =¿(Y, -Po-P.X, _p 2 X 2i -...-P p X pi ) 2 (12.9) 

¡=i ¡=i 

donde las ecuaciones normales para los estimadores mínimos cuadrados serían: 
(X'X)P = X'Y (12.10) 

Este sistema tiene solución única si y solo si la matriz X 'X tiene inversa. 


(X'xr'íX'x^cx'xy'x’Y 


con lo cual se tiene: 


P = (X'X) _1 X'Y 


1 

o 

< CQ. < 
1_ 


1 x n X 21 ... X pl ' 


Y, 

P, 


1 X 12 X 22 ... X p2 


y 2 

P 2 

X = 

1 X 13 X 23 ... X P3 

Y = 

y 2 

Pp 


.1 X ln X 2n ... x pn _ 


Y n _ 


( 12 . 11 ) 


( 12 . 12 ) 
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Si se obtiene la matriz (X ' X)" 1 , y la llamamos C, entonces se puede denotar 
al elemento C. donde ) — 1,2, ... , p, en la suma de productos y cuadrados 
corregidos. 


(X'X)' 1 =c = 


c c 

^11 V-/ I2 

c c 

'“'21 ^22 


C„ 


c * 


Cii 


i» j = l» 2 , P 


la varianza del estimador mínimo cuadrado será: 

V(P j ) = C J a a 

Supuestos del Modelo Poblacional 

Sea el modelo lineal general; 


Y¡ -P 0 +Pi X i¡ + P2X 2 i +---+P p X pi +s¡ 

a. - Homogeneidad de varianza de errores: 

s j ~ N (0, a 2 I) , conE(e¡) = 0 

y V(s¡) = a 2 

b. - Independencia de errores: 

Cov (e¡,Ej) = 0 i ^ j 

c. - Homogeneidad de Varianza de las observaciones: 

c.l.- E(Y,) = E(p 0 + p,X u + P 2 X 2i +...+p p X p¡ ) 


(12.13) 


debido a que E(s¡) = 0 
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c. 2.- V(Y¡) = V(e¡) = a 2 debidoaque: 

V(Po) = VÍP.X,,) = V(P 2 X 2i ) =...= V(P p X pi ) = o 

d. - Independencia de los Y.: 

Cov (Y¡, Yj) = 0 i*j 

Los supuestos de Y. son consecuencia de los supuestos de e ¡, ya que este 
término es el que transforma a Y. en la variable aleatoria y toda función de 
variable aleatoria es también aleatoria. 

e. - Aditividad de los efectos: 

Esta aditividad de los efectos aparece intrínseca en la expresión del modelo 


MÉTODO DE LOS MÍNIMOS CUADRADOS 

Este procedimiento es básico para el desarrollo de los estimadores del 
Modelo de Regresión y por supuesto para la Metodología de la Superficie de 
Respuesta (MSR), ya que a través de la MSR se generan modelos de regresión. 
Fundamentalmente en la MSR se está interesado en obtener una respuesta r|, la 
cual es una función de k variables independientes que seria de la forma siguiente: 

q =f(X,,X 2 ,...,X k ) (12-14) 

La forma q es usualmente desconocida o muy compleja; es necesario 
aproximarla mediante un polinomio de bajo orden. Por ejemplo si se tiene tres 
variables (X,,X 2 ,X 3 ) el modelo resumido seria: 

Y = P 0 +P 1 X . +P 2 X 2 +P 3 X 3 +P 22 X 2 + P 3 3 X 3 + P 1 2 X 1 X 2 +P 1 3 X 1 X 3 + P 23 X 2 X 3 

(12.15) 
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donde P 0 , P,, • • • P 23 , son coeficientes de regresión, Y es la variable respuesta y 
8 es el error experimental. Las variables X t , X 2 ,..., X n son cuantitativas y 
medidas en escala continua. 


Suponiendo que la función f en la ecuación (12.14) es aproximadamente 
un modelo lineal en los X. Se asume que esta aproximación es adecuada, aunque 
la discusión general siguiente, puede ser alterada fácilmente para ser consistente 
con una aproximación de alto orden. Suponiendo que varios tratamientos son 
considerados como varias combinaciones de los X, los datos son escritos en la 
forma siguiente: 

Y, X u X^...,^ 

y 2 X, X, x tó 

Y X, X, X, 

n ln 2n kn 

donde n > k. La combinación actual de niveles experimentales en los X es 
llamado el diseño experimental. El modelo que fue asumido por el 
experimentador puede ser escrito como: 

Y¡ =P 0 +PiX n +p 2 X 2j +...+P p X p¡ + s¡ i = 1,2,3,...,n 

donde Sj es una variable aleatoria. Se asume que el s¡ es independiente, con 
media cero y varianza g 2 , esto es en términos del siguiente vector de errores: 

82 

8 = . 


donde: E(s) = 0 y E(e 8 ') = a 2 I n V(s) = a 2 ■ El modelo de 
la ecuación (12.15) puede ser escrito muy convenientemente en la forma: 

Y = Xp +8 (12.16) 
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donde: 



'Y,' 


V 


"1 

X„ 

X 2t 

-X kl " 

Y = 

y 2 

P = 

p, 

x = 

1 

X, 2 

x 22 

- x k2 


Y n _ 


.Pie. 


1 

X ln 

X 2n - 

•• x kn _ 


El modelo de la ecuación (12.16) se refiere al modelo lineal general. El 
lector puede realmente observar que el modelo lineal general es fácilmente aplicable 
a modelos polinomiales, mayores a los de primer orden. Por ejemplo, supóngase 
que el modelo asumido es un modelo cuadrático en dos variables, esto es, la 
respuesta en el i-ésimo tratamiento envuelve los niveles (X M , X 2| ) es dada por 
la siguiente expresión: 


Y = P 0 + Pl X li + P 2 X 2i + *11 X H + P 2 2 X 2i + Pl2 X li X 2i + £ t 


(12.17) 


donde i = 1,2,... ,n > 6. La matriz X y el vector P pueden ser escritos así: 

rpoi 



’l 

X„ 

X 21 

K 

X^ 

(X„. 

X 21 ) 

X = 

1 

X 12 

X 22 

X? 2 

X^ 2 

(X, 2 

•X 22 ) 


1 

X ln 

X 2n 

XL 

x 2n 

(X,„ 

•X 2n ) 


La atención se centra en la estimación de los parámetros del vector p. El 
método de los mínimos cuadrados es un procedimiento de estimación útil 
particularmente para modelos de la forma de la ecuación (12.16). 
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Dada la matriz X, una función de los niveles preseleccionados, y el vector Y 
de respuesta; el método de los mínimos cuadrados utiliza como estimador de p 
al vector que resulta en un valor mínimo de L, calculado de la siguiente manera: 

L = ¿ sf =s's 

i=l 

La suma de los cuadrados de los errores o desviaciones a partir de la respuesta 
observada para el valor estimado L puede ser escrito así: 

L = (Y-Xp)'(Y-Xp) (12.18) 


entonces: 

L = Y' Y - (xpy Y - Y' xp + (Xpy xp 
= Y'Y —P'X'Y —Y'Xp + p'X'Xp 
= Y'Y-2P'X'Y + P'X'XP 

Para encontrar p: 

SL 

— = -2X' Y + 2(X' X)P 

sp 


igualando a cero: 


(X'X)P = X'Y 


(12.19) 


( 12 . 20 ) 


Asumiendo que X' X es una matriz no singular, se tendrá que: 

P = (X'X)-‘X'Y (12.21) 

Las ecuaciones dadas por (12.20) son llamadas ecuaciones normales para 
la estimación de p. Para el modelo de regresión de primer orden de la ecuación 
(12.16) estas ecuaciones son: 
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( 12 . 22 ) 


Sesgo y Varianza de los Estimadores Mínimos Cuadrados 

Considerando el modelo de regresión Y = X |3 + £ , el estimador de 

(3 será: 

p = (x' xr'x'Y 

E(P) = e{ (X'X)- f [ X'(Xp + e) }] 
e(P) = p + e[ (x'xr’x's ] 

Si la E(s¡) = 0 para i = 1,2,..., n 

E¡ (X'Xr‘X'8 ] = 0 

E(P) = P 

Esto implica que cada uno de los elementos de (3 son estimadores insesgados 

de (3. 


n 2X 

Zx 2i •• 

2X 

Po" 

B. 




Zx H X 2i - 
2X •• 

1 

i 0 R 

1 

P 2 

P k 


Zx 2 ¡y¡ 

IX Y, 


En el desarrollo del Diseño de Experimentos aplicado a la Metodología de 
Superficie de Respuesta es conveniente investigar las características de la matriz 
varianza-covarianza de p , estas serían: 

Cov(P) = E(P-P)(P-P)' 

= Cov[ (X'X)-'X'Y ] 
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Si se considera que (X'X) _I X' contiene solo valores fijos y 
CovY = cTl n , se obtiene: 

Cov(p) = [(X'X)- , X'] 0 2 I n [ (X‘X)X']' 
realizando la simplificación correspondiente 

Cov(P) = ct 2 [(X'X)]' 1 (12.23) 

Esta ecuación (12.23) es muy importante, ya que implica que la varianza de 
los estimadores en p está dada por los elementos de la diagonal de la matriz 
(X'X)- 1 multiplicando cada término por q- 2 y los elementos que se encuentran 
fuera de la diagonal principal multiplicados por CT 2 son las covarianzas. 


V 

p. 



Zx 2i ... 

Zx k , 


Ex?, 

IXx 2i -. 

■ Zx„x k¡ 

P 2 


Ex 2 •• 

• Zx 2i x kl 

P k 


- 


• Ix 2 _ 


PRUEBA DE HIPÓTESIS 
EN EL MODELO DE REGRESIÓN 

Para la realización de las pruebas de hipótesis es necesario establecer los 
siguientes supuestos: 

a. - 8 ~ N(0, a 2 I n ) 

b. -Los Yi son funciones lineales de los s , de modo que también se distribuyen 
normalmente. 
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c, p ~ N(p, ct 2 (X'X) _1 ) 

Para este caso, la matriz X tiene rango p, donde p = k+ lykesel número 
de variables independientes del modelo, el esquema de análisis de la varianza está 
dado en la Tabla 12.1. 

Tabla 12.1 Análisis de la varianza para el modelo de regresión 


F.deV. 

G. de L. 

S. de C. 

CAL 

Regresión 

P 

P'X'Y 

p'X'Y/p 

Residual 

n-p 

Y'Y-pX'Y 

(Y'Y-pX'Y) /(n-p) 

Total 

n 

Y'Y 



En el caso de un modelo de regresión polinomial, el investigador estaría 
más interesado en realizar una partición adicional del modelo de regresión. 
Suponga por ejemplo, un modelo de una función de regresión polinomial 
cuadrática, en este caso es necesario dividir la suma de cuadrados de la regresión 
en los efectos lineales, cuadráticos e interacciones de primer orden de los 
estimadores de los parámetros, con el objeto de explorar la significación de cada 
uno de los efectos. 

Para ilustrar los cálculos necesarios en la construcción de la Tabla 12.1 
considere el siguiente modelo: 

Y¡ =P 0 +P|X, + P 2 X 2 +...+P k X k + s¡ 

y la siguiente transformación: 

Y¡ =P 0 +P,(X 1¡ -X,) + P 2 (X 2i -X 2 )+...+P k (X ki - X k ) + £¡ 
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donde los Xj son los valores promedios de los X ■ en la muestra, donde 
j = 1,2,k. 

Si se realiza la estimación; 


Po 

P, 

C O V p 2 


n 0 


»r'rsv,- 


(12.24) 


donde S n es la suma de cuadrados corregidos de la columna de los X t ; 

S„=Z (Xn-X,) 2 

i=l 

La suma de productos entre X.y X., por ejemplo serían para y X 2 

S,2=Z (Xjj -XJÍX,; -X 2 ) 

i=l 

Los términos serían S. y serían productos entre los X. y los Y, por ejemplo; 
para X t y Y 

S 1Y =¿ (X,j -X,)(Yj - Y) 


y el estimador P o sería: 


Iv, 


„ = Y 


para los estimadores p { , p ,..., j3 k 
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El análisis de la Varianza con la partición de los grados de libertad para la 
regresión sería la siguiente: 


Tabla 12.2. Análisis de Varianza del Modelo de Regresión de primer orden 


Fuentes de Variación 

G.deL. 

S. de C 

Regresión debido a [3 0 

1 

nY 2 

Regresión de X t X 2 ,, X n 

k 

Pl s lY+P 2 S 2Y + "- + Pk S kY 

Residual 

n - k - 1 

diferencia 

Total 

n 

n 

IV 

i=l 


Un cuadro similar puede construirse para el caso de la regresión cuadrática. 
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ESTIMADOR DE a 2 

Inherente al problema de regresión, es importante encontrar el estimador 
de la varianza del error o residual. Se describirá este estimador en base al modelo 
lineal general ya descrito y de la siguiente manera; 


SC Residual = Y'Y-P'X'Y 

= Y , Y-[(X'X) _1 X'Y] X'Y 
= Y' Y — Y' X(X' X) -1 X' Y 
= Y'[l n -X(X'X)"‘X']y 

Se nota que SCResidual es una forma cuadrática de los Y' s cuya matriz sería: 
P = I n -X(X'X) -1 X' 

Si se considera el valor esperado de la SCResidual y se sustituye; 

Y = Xp + s 
E(Y'PY) = E(s'Ps) 

E(e' Ps) = cr 2 Traza P 

la traza de Ip es p, por lo tanto; 

TrX(X' X)' 1 X'- Tr X' X(X' X)" 1 
= Tr I p = p 
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y resulta 


Traza P = Traza (I n - X(X' X)" 1 X') 
Traza P = n - p 
E(SC Re sidual) = a 2 (n - p) 


Si se calcula el cuadrado medio del Residual 


CMRes = 


SC Re sidual 


n-p 


este es un estimador insesgado de <j 2 . 

El valor del estadístico F para la prueba de hipótesis sería entonces: 


Fcalc 


CM Regresión 
CM Residual 


p = k +1 

k = N° de Variables Independientes 
Ftab = F kn _ p 
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USOS DELA ECUACIÓN DE REGRESIÓN 

Una ecuación de regresión puede tener muchos usos, los cuales se podrían 
resumir en los siguientes: 

Descripción y construcción de modelos 

Una ecuación de regresión puede ser usada para describir procesos que 
forman parte de un sistema complejo e interactuante. El propósito de la ecuación 
puede ser puramente descriptivo, a objeto de explicar la naturaleza de esta 
interacción compleja. En este sentido se presentan dos necesidades antagónicas a 
saber: una es explicar la mayor cantidad de variación como sea posible, esto 
sugiere la inclusión de un número elevado de variables en el modelo, la otra 
posición es adherirse al principio del menor número de variables, el cual sugiere 
que se deben tratar de entender en forma fácil la descripción de los procesos con 
tan pocas variables como sea posible. 

En situaciones en los que la descripción es el principal objetivo, se debe 
tratar de seleccionar la menor cantidad de variables independientes que expliquen 
la mayor cantidad de variación de la variable dependiente. 

Estimación y predicción 

Las ecuaciones de regresión pueden ser usadas para predicción, por ejemplo, 
se podría estar interesado en predecir el valor de una futura observación o estimar 
la respuesta media que se corresponde con una determinada observación. 

Tanto la predicción como la estimación se hacen dentro del rango o rangos 
de las variables independientes presentes en el modelo. Cuando una ecuación de 
regresión es usada con estos fines, las variables se seleccionan bajo el criterio de 
minimizar el cuadrado medio del error de la predicción. 

Control 

El propósito de construir la ecuación de regresión podría ser determinar la 
magnitud a la cual las variables independientes se debe alterar, para obtener un 
valor específico de la variable respuesta. En este punto la ecuación de regresión 
es vista como una función de respuesta. Para propósito de control, es deseable 
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que los coeficientes de regresión de las variables sean medidas en 
forma bastante precisa, esto es, que los errores estándar de los 
coeficientes sean pequeños. 

Es de hacer notar que el propósito para el cual el modelo de regresión fue 
construido determina el criterio que debe ser optimizado en su formulación; esto 
supone que un subconjunto de variables puede ser el mejor para un propósito, 
pero no necesariamente será el mejor para otro. El concepto del mejor sub¬ 
conjunto de variables a ser incluidos en una ecuación de regresión siempre requiere 
de un análisis adicional. 


CRITERIOS PARA SELECCIONAR ECUACIONES 
DE REGRESIÓN 

Existen dos posiciones por parte de los investigadores en relación al conjunto 
de variables independientes que deben formar parte de la ecuación de regresión, 
estas son: 

* Incluir el mayor número posible de las variables predictoras, que contienen 
la mayor información sobre las variables que puedan influenciar la respuesta, a 
objeto de que los valores ajustados sean los más confiables y seguros con fines de 
predicción. 

* Incluir en el modelo solamente las variables de mayor relevancia en el 
fenómeno bajo estudio, ya que en la mayoría de los casos es impráctico u oneroso 
recabar información no necesaria y procesarla y además porque la varianza de 
las predicciones aumenta al aumentar el número de variables regresoras. 

La posición conciliadora entre las dos, parece ser la que ha dado mejores 
resultados y es la que muchos autores han llamado “la mejor ecuación de regresión” 
o “la ecuación mas adecuada”. A este respecto Hocking (1976), señala que cuando 
se trata de determinar la ecuación más apropiada, basada en un subconjunto de 
variables, se deben tener en cuenta tres aspectos: 

a. - El criterio utilizado para analizar y seleccionar el subconjunto. 

b. - La estimación de los coeficientes de la ecuación final. 
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c.- La técnica computacional usada en el análisis de los datos. 

En la literatura se han propuesto varios criterios para seleccionar 
la mejor ecuación de regresión. Hocking (1976), señala una lista 
bastante extensa de criterios a saber: 

1.- El cuadrado del coeficiente de correlación múltiple o coeficiente de 
determinación. 


R 


2 

P 


SCRp 

SCT 


SCR = Suma de Cuadrados debida a regresión 
SCT = Suma de Cuadrados Total. 

2.- El coeficiente de determinación ajustado. 



( n — i)(i — Rp) 
n-p 


3.- El cuadrado medio de residuales. 


SCE 

CME d --- 

p n-p 

4.- El cuadrado del error total o estadístico C de Mallows. 

P 


C 


SCE„ 


a 


' + (2p - n) 


5.- Promedio de la varianza de predicción. 

(n + p) 

J =--~CME„ 
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6.- Promedio del cuadrado medio del error de predicción. 

CME p 

P (n-p-1) 


7.- Suma de cuadrados de residuales estandarizada. 


SCE p — s' p Dp e p 


8.- Suma de cuadrados de predicción. 


Pressp = e' p D p 2 e p 

9. - Correlaciones parciales. 

10. - Estadísticos de Andrews y Pregiben. 

11. - Suma de mínimos errores absolutos ponderados. 

12. - Criterios de F parcial y F secuencial. 

13. - Uso de parámetros infinitos. 

14. - Suma de mínimos errores absolutos. 

15. - Suma de mínimos errores relativos. 
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EJEMPLO ILUSTRATIVO DE REGRESIÓN MÚLTIPLE 

En el siguiente cuadro se presentan los datos correspondientes a capacidad 
de intercambio catiónico (Y), % de carbono orgánico (X x ) y % de arcilla (X 2 ) en 
20 muestras de suelo. 


Muestra 

Y 

X , 

*2 

1 

21,80 

2,69 

24,00 

2 

26,07 

2,03 

35,80 

3 

19,77 

2,72 

20,83 

4 

28,09 

2,80 

31,00 

5 

38,84 

3,73 

29,00 

6 

29,60 

2,99 

57,60 

7 

32,42 

0,66 

8,73 

8 

31,01 

0,98 

13,68 

9 

24,64 

1,42 

2920 

10 

28,45 

3,62 

29,43 

11 

29,03 

329 

4020 

12 

2429 

2,36 

35,80 

13 

8,13 

126 

17,00 

14 

12,11 

1,55 

1520 

15 

16,96 

2,55 

20,40 

16 

1820 

2,11 

27,40 

17 

1120 

120 

15,03 

18 

17,32 

1,97 

27,70 

19 

33,88 

2,14 

52,80 

20 

33,50 

2,05 

35,10 

Totales 

485,41 

44,13 

566,20 

Promedios 

242705 

22065 

28,3100 

Suma de Cuadrados corregidas 


Y 


x. 


1329,709 

14,1063 

2957,058 


Suma de productos 



YX, 


X,X, 


48,7158 

924,262 

109,5244 
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1. - Modelo Poblacional planteado. 

Y = P 0 + P,X n + P 2 X 2¡ + s¡ 

2. - Supuestos del modelo 

Y ~ (P 0+ p 1 X li+ P 2 X 2i , a 2 ) 
Los Xi son fijos. 

S¡ ~ NID (0, a 2 ) 

3. - Hipótesis 


3.1 Anavar 

Ho: p, = P 2 =0 

Ha: p¡ * 0 



3.2 Pruebas de t 

Ho: p, =0 

Ho: p 2 =0 

Ho: p 0 =0 

Ha: Pj *0 

Ha: P 2 ^0 

Ha: p 0 *0 

b, -p x 

b 2 ~P 2 

b 0 -Pi 

t, - 

^2 

tj - c 

s b, 


Su 

D 0 
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3.3 Matriz Varianza-Covarianza del modelo de estimación 


V(b 0 ) 

Cov(b 0 ,b,) 

Cov(b 0 ,b 2 ) 


Cov(b 0 ,b[) 

V(b,) 

Cov(b| ,b 2 ) 


Cov(b 0 ,b 2 ) 

Cov(b,,b 2 ) 

V(b 2 ) 


4.- Pruebas de significación 
4.1 Análisis de Varianza 


F.deV. 

G. deL. 

S.deC. 

C.M. 

Regresión 

k 

Zb¡SP yx¡ 

SCReg/k 

Residual 

n-k-1 

Diferencia 

SCResidual/(n - k -1) 

Total 

n -1 

X(Y-Y) 2 



4.2 Cálculo de los coeficientes de regresión 
4.2.1 Método aritmético simple 

4.2.1. a Cálculo de los coeficientes de correlación simple 

SPyx, „ SP YX2 r SP X|X; 

Y -' V SC v SC x, rY ' 2 V SC v SC x 2 r ’ 2 V SC x, SC x 2 

4.2.1. b Cálculo de los coeficientes de regresión parcial 


b Y - 

‘1.2 


1 — r. 


1 — r, 


1.2 
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4.2.l.c Establecimiento del modelo 


Y = Y + b 


Y1.2 


VSCY 

^/SCX, 


(X,-X 1 ) + b, 


VSCY 

7scx 2 


(X 2 -X 2 ) 


4.2.2 Métodos de los determinantes con las ecuaciones normales 

4.2.2.a Ecuaciones normales 


sp yx , - SC X| (3 ,+sp X iX2 (3 2 
^Pyx 2 = SP X| x 2 Pi+SC X2 P 2 

4.2.2.b Determinantes 


SC,, 


B= 

^YX| 


c=: 

SQ, 

SP«, 




SP^ 

9^ 


qj 

cp 

YX, 



B' 



C' 



b, ' = 

— 


b 

r_ 

— 



1 

A' 



z A' 



4.2.2.C Establecimiento del modelo de estimación 


Y = Y + b,(X,-X 1 ) + b 2 (X 2 - X 2 ) 
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5.- Desarrollo del ejemplo 

5.1 Cálculo de los coeficientes de regresión 
5.1.1 Método aritmético simple 

5.1.1.a Cálculo de los coeficientes de correlación simple 


48,7158 

r =--— — 0 7557 

Y -' 1329,709x 14,1063 ’ 

924,262 

r v.2 - 13 29 ; 709 x 2957,058 = 0,4661 
109,5244 

r '- 2 “ 14,1063 x 2957,058 = °’ 5363 


5.5.1.b Cálculo de los coeficientes de regresión parcial 


0,3557-0,4661 x 0,5363 
l-0,5363 2 


0,1489 


0,4661-0,3557 x0,5363 
1 — 0,5363 2 


0,3885 


5.5.1.cEstablecimiento del modelo 


Y = 24,2705+ 0,15 


■71329,7095 

14,1063 


(X, 


-2,21)+0,39 


^1329,7095 

72957,058 


(X 2 


28,31) 


Y - 13,6535+ 1,4545X, +0,2615X 2 
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5.1.2 Método de los mínimos cuadrados 

B' (48,7158 x 2957,058)-(924,262 x 109,5244) 
b) = A 7 " (14,1063 x2957,058)-(109,5244) 2 

C' (14,1063 x 924,262) - (109,5244 x 48,7158) 
bí = A 7- (14,1063 x 2957,058)-(109,5244) 2 

Y = 24,2705 + 1,4545(X, - 2,2065) + 0,2615(X 2 - 28,31) 

Y = 13,6535 + 1.4545X, +0,2615X, 


5.2 Pruebas de significación para el modelo 


5.2.1 Suma de cuadrados total=SCT 


SCT = £y 2 



1329,709 


5.2.2 Suma de cuadrados de regresión = SCREG 

SCREG = 1,4545 x 48,7158+0,2615 x 924,262=309,6892 

5.2.3 Suma de cuadrados de residual = SCRES 
SCRES = SCT - SCREG = 1329,709 - 309,689 = 1020,020 


= 1,4545 

0,2615 
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5.2.4 ANAVAR 


F.deV. 

G.deL. 

S.C. 

C.M. 

F 

Regresión 

2 

309,689 

154,845 

2,58 n.s. 

Residual 

17 

1020,020 

60,00 


Total 

19 

1329,709 




R 2 


309,689 

1329,709 


0,2328 


5.3 Prueba de significación para los coeficientes de regresión 

531Parab, 


t,= 


A. 

sb. 


sb, = ^/CMRES x C u 
r _SC(X 2 ) 

'-'II ~ 

C„ = 


SC(X 2 ) 


D 


SC(X,).SC(X 2 )-(SPX,X 2 ) 2 


2957,058 


14,1063 x 2957,058-109,5244 2 
sb, = ^60,00 x 0,0995 = 2,4433 
1,4545 


= 0,0995 


t.= 


2,4433 


;0,59 n.s. 
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5.3.2 Para b 2 


* 2 sb. 


sb 2 = ^CMRES x C 2 


r - 
'“'22 


SC(X,) 14,1063 


D 29717,553 
sb 2 = y/60,00 x 0,0005 = 0,1687 
0,2615 


= 0,0005 


*■2 — 


0,1687 


= 1,54 n.s. 


6. Interpretación 

De acuerdo a los resultados del ejemplo, no existe una relación lineal múltiple 
entre la capacidad de intercambio catiónico y las variables independientes contenido 
de carbón y % de arcilla. Los especialistas en suelo indican que estas variables 
están asociadas, sin embargo, en este ejemplo, no se evidenció esa asociación 
debido quizás a los siguientes motivos: 1) el tamaño de la muestra es bajo n=20, 
2) La relación funcional no es lineal sino de cualquier otro tipo, polinomial, 
cuadrático, exponencial, logarítmico, entre otros. 3) No se tomaron en cuenta 
otras variables independientes que pueden influir para aumentar la determinación 
del modelo. 

EJEMPLO ILUSTRATIVO DE REGRESION CON MATRICES 

Los datos que se presentan a continuación son correspondientes a un 
experimento realizado con el cultivo de maíz donde XjfDistancia entre hileras), 
X 2 (Número de mazorcas por m 2 ), X 3 (Número de granos por mazorca) y Y 
(Rendimiento granos en Ton/ha.). 
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f --— 

X, 

Y 


X 3 

Distanciamiento 

(cm) 

Rendimiento Número de 

Granos(Ton/ha) Mazorcas/m 2 

Número Granos 
por mazorca 

20 

11,56 

20,3 

206 

20 

12,00 

21,0 

215 

20 

10,40 

19,0 

180 

25 

10,66 

13,4 

361 

25 

9,80 

12,8 

354 

25 

11,50 

13,6 

371 

30 

9,82 

11,0 

394 

30 

9,60 

10,8 

380 

30 

9,50 

10,0 

350 

40 

9,28 

6,3 

605 

40 

9,00 

6,0 

600 

40 

6,30 

5,9 

580 

50 

7,55 

4,0 

671 

50 

7,00 

3,5 

642 

60 

6,00 

3,0 

670 

60 

6,20 

3,2 

680 

60 

5,80 

2,8 

643 

100 

2,29 

1,2 

621 

100 

2,50 

1,3 

650 

100 

3,00 

1,8 

670 


349 



Dr. Franklin Chacin 


1.- Modelo poblacional planteado 


Y¡ - P 0 + Pi x i¡ + P 2 X 2¡ + P 3 X 3i + e¡ 

Y¡ = variable dependiente 
X 1¡ ,X 2i ,X 3j = variables independientes 
p 0 = intercepto 

P,,P 2 ,P 3 = coeficientes de regresión de las respectivas 
variables independientes 
e¡ = efecto aleatorio. 

2. - Supuestos del modelo 

Xjj son fijos 
E(s¡) = 0 
V(S i ) = CT 2 

Y¡ esta distribuido (p 0 +p,X lj + P 2 X 2¡ + P 3 X 3¡ ,cr 2 ) 
e¡ esta distribuido ( 0 , a 2 ) 

3. - Hipótesis a probar 

3.1 ANAVAR 

Ho: P[ = P 2 = P 3 = 0 
Ha: p¡ ^ 0 
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Ho:P 0 =0 
Ha:p 0 *0 
Ho.'P, =0 
Ha:p, *0 
Ho:p 2 =0 
Ha:p 2 *0 
Ho:p 3 =0 
Ha:p , y 0 



3.3 Matriz Varianza-Covarianza 


^b 0 b t ^b 0 b 2 ^b 0 b 3 

s b, s b,b 2 s b,b 3 

S b 2 S b 2 b 3 

S b 

b 3 J 

4.- Modelo de estimación 

4.1.- La estimación de los coeficientes de regresión del modelo se hace a 
través del método de los mínimos cuadrados utilizando el enfoque matricial. Se 
parte del modelo (simplificado matricialmente) 


S = (X'X)'‘a 2 = 
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Y = Xp + £ 



Y, 


1 

x„ 

X 21 

x 3] 


y 2 


1 

X I2 

X 22 

X, 2 

Y = 

y 3 

x= 

1 

X¡3 

X 2 3 

X 33 


Y n . 


1 

X ln 

X 2n 

X 3r) _ 


Po‘ 


V 




P = 

P, 

P 2 

8 = 

£ 2 





P 3 . 


,s n _ 





4.2 Determinación de las ecuaciones normales 

Y = Xp + 8 
8 = Y - XP 

e' e = (Y - Xp)' (Y - XP) 

e' e = Y' Y - Y' Xp - (XP)' Y - (Xp)' (Xp) 

e'e = Y'Y-2p'X'Y + p'X'P 

Ss'e 

-gp- = -2X Y + 2X' Xp = 0 

X' Xp = X' Y Ecuaciones Normales 
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4.3 Si se cumple que la matriz X'X es no singular se realiza la 
premultiplicación de ambos términos de la ecuación por (X 'X) 1 obteniéndose; 


(X'X)- 1 X'Xp = (X'X)" 1 X'Y 
(3 = (X'X) -I X'Y 

(12.25) 

siendo la ecuación (12.25) la que permitirá estimar los coeficientes del modelo. 


5.- Pruebas de significación 

5.1 Análisis de Varianza (ANAVAR) 


F.deV. 

G.deL. 

S.C. 

C.M. 

F 

Regresión 

Residual 

k 

n-k- 1 

B'X'Y-n Y 2 

Y'Y-B'X'Y 

SCRegresión/k 

SCResidual/n-k-1 

CMRegresión/ 

CMResidual 

Total 

n-1 

Y'Y-nY 2 
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5.2.-Pruebas det. 

t --^2_ t = A_ t = h- t = h. 

0 “ sb 0 1 sb, 2 sb 2 3 sb 3 

S 2 =(X'X) _1 o 2 =(X'X) _1 CM Residual 
Si t¡>t t _ l n _ k _j Se rechaza Ho 
Si t i <t t _ ln _ k _j No se rechaza Ho 


6.- Prueba de Bondad de Ajuste del Modelo 
6.1.- Coeficiente de Correlación Múltiple 

SC Re gresion 
R= SCTotal 

Este coeficiente indicaría el grado de asociación que existe entre la variable 
dependiente (Y) y la función de regresión de las variables independientes (X p X 2 , 


6.2.- Coeficiente de determinación 


R 2 = 


SC Re gresion 
SCTotal 


xlOO 


Este coeficiente permite conocer cuanto de la variabilidad total es posible 
explicar con el modelo de regresión obtenido. 
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7.-Desarrollo del ejemplo: 

7 J. .-Estm adán de los aoefidaites de regresión 


(3 = (X'X) ‘X'Y 


"11,56' 


"1 

20 

20,3 

206" 

12,00 


1 

20 

21,0 

215 

10,40 

X = 

1 

20 

19,0 

180 

2,50 


1 

100 

1,3 

650 

3,00 _ 


1 

100 

1,8 

670 


7,173 

- -0,088 
^ = 0,253 

_ 0,006 

7.2.- Pruebas de significación. 


7.2.a.- Análisis de varianza 


F.deV. 

G. deL. 

SC 

CM 

F 

Regresión 

3 

165,2875 

55,095 

277,81 

Residual 

17 

3,371474 

0,198322 


Total 

20 
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7.2.b.- Pruebas de t. 


t 0 

ti 

t 2 

t 3 


7,173 


1,9497 
- 0,08774 
0,00673 
0,2526 
0,07546 “ 
0,00568 


= 3,68* 

= -13,04** 
3,35* 


0,00242 


= 2,34 * 


7.3.- Bondad de ajuste del modelo. 


R 2 


SC Re gresion 
SCTotal 


xlOO = 98% 


8.- Matriz de Correlación. 


Dist (X,) 

Dist (Xj ) 
1,0000 

Rend. (Y) 

Mazorcas (X,) 

Granos (X 3 ) 

Rend. (Y) 

-0,9802 

1,0000 



Mazorcas (X 2 ) 

-0,8094 

0,8597 

1,0000 


Granos (X 3 ) 

0,7490 

-0,7856 

-0,9705 

1,0000 


Según los datos anteriores la variable independiente que está mayormente 
correlacionada con Y es el distanciamiento (XJ, con un coeficiente de correlación 
muy alto -0,9802. El signo negativo señala que las tendencias entre las variables 
son opuestas; es decir, al aumentar la separación o distancia entre las plantas 
disminuye el rendimiento. Lo mismo ocurre con la relación entre la Distancia 
(Xj) y el número de mazorcas por metro cuadrado (X,); sin embargo el hecho de 
que la correlación entre Distancia (XJ y el número de granos por mazorca (Xj) 
sea de signo positivo sugiere que si bien cuando se aumenta la distancia entre las 
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plantas disminuye el número de mazorca por metro cuadrado (X 2 ), el tamaño o 
peso de mazorcas obtenidas a baja densidad de siembra (distancia de separación 
grande) debe ser mayor, ya que el numero de granos por mazorca aumenta 
cuando la separación entre las plantas es mayor. 

9.- Con un ejercicio asignado por su profesor realice las siguientes actividades. 

.- Hacer un diagrama de esparcimiento sobre una gráfica 

Calcular la ecuación de regresión por el método de los mínimos cuadrados 
utilizado de matrices y vectores. 

.- Establecer hipótesis y supuestos respectivos 

.- Esquema de Anavar. 

.- Prueba de hipótesis. 

Bondad de Ajuste del modelo. 

.- Interpretación. 


357 




Capítulo 13 

ANÁLISIS DE COVARIANZA 


Introducción 

Así como el análisis de la varianza se presentó como una metodología o 
técnica sencilla que se utiliza para obtener información, en este tema se tratará de 
describir de manera sencilla otro tipo de análisis que es de gran utilidad en la 
investigación agrícola, el cual se refiere como Análisis de Covarianza y representa 
otra de las técnicas que puede ser utilizada con el objeto de reducir la varianza 
experimental. 

En la respuesta de un ser vivo (planta o animal) sometido en un ensayo a la 
aplicación de unos tratamientos, influyen una serie de factores que pueden ser 
medidos o cuantificados por el investigador; muchos de estos factores pueden a 
su vez ser controlados por el Diseño Experimental que se esté usando, otras en 
cambio a pesar de que pueden ser observadas y medidas no son, sin embargo, 
controlables como fuentes de variación del diseño, a este tipo de factores se les 
denomina covariables o variables concomitantes. 

Si se denomina Y a la respuesta que el sujeto de investigación (animal o 
planta) da a la aplicación de un tratamiento cualquiera, se puede denominar como 
X el efecto de otro factor que pueda estar actuando. Véase el siguiente par de 
ejemplos: 

* Si se aplican dosis diferenciales de fertilizantes a un cultivo; el rendimiento 
(Y) que produzca el cultivo como respuesta, pudiese estar influenciado por la 
acción real del fertilizante en sí como también por el número de plantas presentes 
en la unidad experimental o parcela. 

* Si se desea medir el efecto de varias raciones alimenticias (con distintos 
valores de proteína por ejemplo), se éscogen un grupo de animales, se pesan al 
inicio del ensayo y posteriormente al concluir el período experimental, la diferencia 
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entre estas dos pesadas sería la respuesta de los animales a la aplicación de las 
distintas raciones puede deberse a un efecto real de los tratamientos (Y) o 
sencillamente el peso final podía estar afectado por el peso inicial (X). 

En ambas situaciones al investigador lo que le interesa es comparar la bondad 
de los tratamientos, respuesta de plantas o animales a la aplicación de los 
tratamientos (variable Y) libre del efecto de la covariable X (número de plantas y 
peso inicial, en los ej emplos). Para ello tiene que recurrir al Análisis de Covarianza, 
la cual es una metodología sencilla que hace uso de conceptos conocidos tales 
como Análisis de Varianza y Análisis de Regresión, permitiendo comparaciones 
de los tratamientos libres del efecto de la covariable. 

La covarianza tiene otra aplicación importante en Investigación Agrícola 
cuando se usa como método para la obtención (estimación) de datos faltantes en 
un experimento. 


Modelo y Supuestos básicos del Análisis de Covarianza 

El modelo lineal aditivo para cualquier diseño es el mismo que corresponde 
al análisis de Varianza, pero lleva un término adicional correspondiente a la variable 
concomitante. A continuación se presentan los modelos correspondientes a los 
tres diseños clásicos: 

*' Completamente aleatorizado. 

* Bloques al azar 

* Cuadrado latino 
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Desarrollo del Análisis de Covarianza 

La metodología en términos generales consiste en los siguientes pasos: 

* Hacer análisis conjunto de Varianzay Covarianza. 

* Con los datos correspondientes al error experimental (EE), realizar 
una prueba de significación para la regresión que indique si hay o no 
efecto de la covariable. 

* Realizar una prueba de significación de tratamientos corregidos. 
"'Ajustarlos rendimientos, usando la ecuación de regresión transformada. 

* Hacer comparaciones de medias ajustadas. 

Con el uso de algunos ejemplos numéricos se demostrará el uso de esta 
metodología. 


Ejemplo de Análisis de Covarianza en Diseños Completamente 
Aleatorizados. 

Suponga que se realiza un ensayo comparativo de selecciones de algodón y 
se obtiene información sobre rendimiento (Y) y porcentaje de infestación (X) de 
una enfermedad causada por un hongo. (Tabla 13.1). Las diferencias entre los 
tratamientos pudieran deberse a efectos genéticos reales de producción entre las 
selecciones o sencillamente a que algunas son más atacadas que otras en el hongo. 
Para establecer si este último ocurre, se procede de la siguiente manera: 
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Tabla 13.1 Datos de un diseño completamente aleatorizado en presencia de una 
covariable. 


SELECCIONES DE ALGODÓN 

Parcela ABC DE 


s 

X 

Y 

X 

Y 

X 

Y 

X 

Y 

X 

Y 

1 

30 

80 

42 

77 

30 

80 

38 

90 

38 

87 

2 

64 

73 

56 

74 

32 

66 

26 

76 

16 

75 

3 

54 

70 

60 

75 

28 

79 

34 

87 

36 

72 

4 

48 

79 

46 

86 

32 

90 

12 

96 

16 

91 

5 

88 

71 

64 

77 

56 

72 

32 

89 

28 

90 

6 

40 

74 

32 

73 

28 

76 

42 

80 

32 

73 

Totales 

324 

447 

300 

462 

206 

463 

184 

618 

166 

488 

5 > = 

1100 

X 

= 39,30 

IY 

= 2378 


Y = 79,27 
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Aplicación del Procedimiento: 


Primer Paso: 

Se determinan las sumas de cuadrados para ambas variables X e Y por la 
vía usual y las sumas de productos de la siguiente manera: 

* Suma de Productos para el total: 


r/ , , , (1180x2378) 

SPTotal = [(30x80)+ (64x73)+...+(32x73)]--—-= -1679 

* Suma de Productos para selecciones de algodón (tratamientos) 

SPTrat = j^[(324x447)+...+(l66x488)]- F.C.= -1014 


* Suma de productos para el error 

SPEE = SPTotal- SPTrat = -1679 - (-1014) = -683 

Con estos datos se construye la tabla siguiente: 


F.deV. 

G. deL. 

SCX 

SPXY 

SCY 

Selecciones (T) 

4 

3391 

-1014 

519 

Error (E) 

25 

4412 

-683 

1183 

Total 

29 

7803 

-1697 

1702 


Ahora se puede probar la hipótesis (Ho) para las medias de rendimiento 
(Y) y porcentaje de infestación (X). 
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F. 


519/4 129,75 


47,32 


' 1183/25 

3391/4 


= 2,74 (n.s.) 


F. = ■ 


4412/25 176,49 


847,75 

-= 4,80* 


El análisis sin ajuste por covariable indica que no hay diferencias entre las 
medias de rendimientos de las selecciones (no se rechaza Ho), pero si hay diferencias 
entre las medias correspondientes a los porcentajes de infestación; es decir, el 
comportamiento de las selecciones con relación al ataque del hongo es diferente 
(se rechaza Ho). 

Segundopaso: 

Para poder establecer si el efecto del porcentaje diferencial de ataque de 
hongos afecta la producción se debe hacer una prueba de significación para 
regresión: 


F.deV. 

G. de L. 

S.deC. 

C.M. 

F 

R* 

Regresión 

1 

105,73 

105,73 

2,36 

2,49 

Desv. de Reg. 

24 

1077,27 

44,83 



Residual 

25 

1183 





Se utilizan los datos del Error Experimental del cuadro anterior. 


-. Suma de Cuadrados para efecto de regresión 


SCReg = 


(spxy e ) 2 

SCX E 


(—683) 2 
4412 


105,73 
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Suma de cuadrados para desviaciones desde la regresión 

SC D = SCY E - SCR = 1183- 105,73 = 1077,27 

Este análisis revela que a pesar de que el comportamiento de las selecciones 
frente al ataque del hongo es diferente, este hecho no afecta mayormente la 
producción (2,36 < 2,49); es decir, se puede hacer las comparaciones de medias 
con los datos originales sin ajustes por covarianza. No obstante para seguir 
demostrando el método se supone que si hubo significación para la regresión de 
Y sobre X; es decir efecto del porcentaje de infestación sobre el rendimiento. 

TercerPaso: 


El siguiente paso consiste en hacer una prueba de significación para 
tratamientos ajustados. 


F.deV. G.deL. 


S. de C. C.M. 

F 

Tratamientos(T') 

4 

255,73 

64 l,43(n.s.) 

Error(E') 

24 

1077,27 

44,9 

(T + E)' 

28 

1333,00 



En este análisis se pierde un grado de libertad, el que se usó para la regresión. 
-. Suma de Cuadrados de (T + E) corregido. 


SC(T+ E)'= scwow- . 1702 _ . 1333 

SCXtotal 7803 

-. Suma de Cuadrados del Error Corregido 

(SPXYres) (-683) 2 

5 CE' = SCYres- ^ 7 :- 1 = 1183 - = 1077,27 


SCXres 


4412 
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Suma de Cuadrados de tratamiento Corregido 

SCT' = SC(T+ E)'-SCE' = 1033,00- 1077,27 = 255,73 

En este caso no hay diferencias válidas entre tratamientos, igual que cuando 
se hizo el análisis sin ajuste por covarianza; suponiendo que si hubo diferencias; se 
necesita hacer los correspondientes ajustes de medias de tratamientos. 

Cuarto paso. Ajuste demedias: 

Partiendo del modelo: 


Y.-/d (Xj- X..) = /J+ T¡ + £¡ 

tomando el lado izquierdo de la igualdad como rendimiento libre del efecto de 
X y generalizando, entonces, 

Y, = Y-b(X-X..) 


que dará el rendimiento ajustado Y¡ de un tratamiento cualquiera, en función de 
su promedio original Y¡; b es el coeficiente de regresión y x es el promedio de 
porcentaje de infestación de dicho tratamiento y x es la media general de los 
porcentajes de infestación. 




Ajustes de medias 


Selecciones 

M 

b(M-a.) 

Yi-b(M-a.) 

A 


74,5 

-0,1548(54,0-39,3) 

76,0 

B 


77,0 

-0,1548(50.0-39,3) 

78,7 

C 


112 

-0,1548(34,3-39,3) 

76,4 

D 


863 

-0,1548(30,7-39,3) 

85,0 

E 


813 

-0,1548(27,7-39,3) 

79,5 


SPXY F 

- 683 



b = 

n, 


= -0,1548 



SCX E 

~ 4412 
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Quintoposo: 


Comparación de medias para la aplicación de la prueba de medias mds, en 
este caso se usa como una expresión del error típico de la diferencia de dos 
medias la siguiente expresión:_ 


Sd 


i 


CME' 


l + ± + (X .- 


X 2 ) 2 


scx r 


Donde CME' = varianza del Error Experimental en la prueba de significación 
para tratamientos corregidos. 

Xj = promedio de % de infestación de una selección (tratamiento) 

X 2 = promedio de % de infestación de la otra selección (tratamiento) 
n 1 yn 2 = número de observaciones para los tratamientos respectivos. 

SCX E = Suma de Cuadrados para X del primer análisis. 


En el ej emplo, si se compara la media de E con la de A: 

\ 2 ' 


Sd = 44,9 


1 J_ (54,0-27, 7) 
6 + 6 + 4412 


= 4,69 


En este caso como no hay diferencias significativas entre tratamientos 
(selecciones) no es necesario hacer comparaciones de medias. 


Ejemplo de Análisis de Covarianza en Diseños en Bloques Aleatorios 


Sea un ensayo comparativo de seis variedades de papas del cual se obtiene 
rendimientos (Y) y número de plantas por parcela (X). 
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Tabla 13.2 Datos de un diseño en bloques aleatorizados en presencia de una covariable. 


Variedades 



X 

I 

Y 

X 

II 

Y 

X 

III 

Y 

X 

IV 

Y 

Totales 

X Y 

A 

28 

202 

22 

165 

27 

191 

19 

134 

96 

692 

B 

23 

145 

26 

201 

28 

203 

24 

180 

101 

729 

C 

27 

186 

24 

185 

27 

185 

28 

220 

106 

778 

D 

24 

201 

28 

231 

30 

238 

30 

261 

112 

931 

E 

30 

202 

26 

178 

26 

198 

29 

226 

111 

904 

F 

30 

228 

25 

221 

27 

207 

24 

204 

106 

860 

Totales 

162 

1166 

151 

1181 

165 

1222 

154 

1225 

632 

4794 




X!. 

.. = 632 / 24 - 

- 26,33 






PrimerPaso: 

Se obtienen las sumas de productos y Sumas de Cuadrados de ru tina 


* Suma de Productos para el total: 

SPTotal = [(28 x 202)+...+(24 x 204)] - í 632 *^ 794 ) _ 14Q5 

’ Suma de Productos para repeticiones 

SPRep = ^[(162 x 1166)+.. .+(154 x 1225)] - F. C . = 8,50 
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* Suma de Productos para tratamientos 

SPTrat = }/ 4 [( 96x692)+...+(106x860)] - F.C.= 559,25 


* Suma de productos para el error 


SPEE = SPTotal- SPRep- SPTrat = 1485 - 8,50 - 559,25 = 917,25 


Con estos datos se construye la tabla siguiente: 


F.deV. 

G. de L. 

scx 

SPXY 

SCY 

Total 

23 

181,33 

1485 

18678,50 

Repeticiones 

3 

21,67 

8,50 

436,17 

Selecciones (T) 

5 

45,83 

559,25 

9440,00 

Error (E) 

15 

113,83 

917,25 

8752,33 

T + E 

20 

159,66 

1476,50 

18242,33 


Ahora se puede probar la hipótesis (Ho) para rendimiento (Y) y número 
de plantas (X). 


9440/5 

y ~ 8752,33/15 
45,83/5 


1888 


583,49 
9,17 


= 3,24* 


113,83/15 7,59 


= 1.20 n.s. 


El análisis sin ajuste por covariable indica que hay diferencias entre las medias 
de rendimientos de las selecciones (se rechaza Ho), pero no hay diferencias entre 
las medias correspondientes a número de plantas (no se rechaza Ho). 
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Segundopaso: 


Prueba de significación para regresión: 


F.deV. 

G. de L. 

S. de C. 

C.M. 

F 

Regresión 

1 

7391,26 

7391,26 

77,57 

Desv. de Reg. 

14 

1334,07 

95,29 


Residual 

15 

8725,33 




Se utilizan los datos del Error Experimental del cuadro anterior. 
Suma de Cuadrados para efecto de regresión 


SCReg = 


(SPXY E ) 2 (917,25 2 ) 


SCX, 


113,83 


= 7391,25 


Suma de cuadrados para desviaciones desde la regresión 


SC D =SCY e -SCR = 1334,07 

En este caso si hay influencia notable del número de plantas (X) sobre el 
rendimiento (Y), es decir hay regresión de Y sobre X, por lo tanto se requiere 
ajustar tratamientos. 

TercerPaso: 


Prueba de significación para tratamientos ajustados. 


F.deV, 

G. de L. 

S. de C. 

C.M. 

F 

Tratamientos' 

5 

3253,92 

650,70 

5,83** 

Error' 

14 

1334,07 

95,29 


(T + E)' 

19 

4587,99 




370 








_ Diseño y Análisis de Experimentos 15 

-. Suma de Cuadrados de (T + E) corregido. 


(SPXY r f ) 2 (1476,50) 2 

SC(T+ E)' = SCY r+£ - T+LJ = 18242,33 - 'J = 4587,99 

uL/A. I J7 jOu 

Suma de Cuadrados del Error Corregido 

(SPXY E ,) (917,25) 2 

SCE' = SCYres- —-- = 8752,33 - V ’ = 1334,07 

SCX E 113,83 

Suma de Cuadrados de tratamiento Corregido 
SCT' = SC(T+ E) - SCE' = 4587,99 -1334,07 = 3253,92 


El ajuste hecho a los tratamientos aumenta la significación entre los mismos. 

Cuarto paso. Ajuste de inedias: 

Partiendo del modelo: 


Y -fi (X¡-X..) = //+ r¡ +s¡ 

tomando el lado izquierdo de la igualdad como rendimiento libre del efecto de 
X y generalizando, entonces, 

Y, = Y¡- b(X¡-X..) 


Ajustes de medias 


Variedades 

Yi 

b(Xi - X..) 

Yi - b(Xi - X..) 

A 

173,00 

8,05 (24,00 - 26,33) 

191,80 

B 

182,25 

8,05 (25,25 - 26,33) 

191,00 

C 

194,50 

8,05 (26,50 -26,33) 

193,10 

D 

232,75 

8,05 (28,00 - 26,33) 

219,30 

E 

201,10 

8,05 (27,75 -26,33) 

189,60 

F 

215,00 

8,05 (26,50 - 26,33) 

213,60 
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X = 26,33 

SPXY e 917,25 
" SCX E ~ 113,83 


8,05 


Quintopaso: 


Comparación de medias para la aplicación de la prueba de medias mds, en 
este caso se usa como una expresión del error típico de la diferencia de dos 
medias la siguiente expresión:_ 


Sd = JCME' 


1,1, (X,~X 2 ) 2 
n, n, SCX.. 


Donde CME' = varianza del error experimental en la prueba de si gnifi cación 
para tratamientos corregidos. 

Xj = promedio de plantas de una variedad (tratamiento) 

X 2 = promedio de plantas de la otra variedad (tratamiento) 

n ( yn 2 = número de observaciones para los tratamientos respectivos. 

SCX E = Suma de Cuadrados para la covariable. 


En el ejemplo, si se compara la media de D con la de E: 


Sd = n 95,29 


\ J_ (28,00-27,75) 2 
6 + 6 + 113,83 


5,64 


. 219,30-189,60 

tc=-——— = 5,27 ** 


5,64 

Y 2,98 

Para niveles de significación de 0,05 y 0,01 respectivamente. 


t, ah = 2,62 


Existen diferencias altamente significativas entre D y E los cuales son los 
rendimientos extremos. Se procede de igual forma para las otras comparaciones 
posibles. 
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Ejemplo de Análisis de Covarianza en Diseños Cuadrados Latinos 


Resultados en lb-parcela (Y) y número de plantas en un ensayo de seis líneas 
de maíz (datos tomados de Federer). 


Tabla 13.3. Datos de un diseño en cuadrados latinos en presencia de una covariable. 


Linea 

A 

B 

C 

D 

E 

F 

Total 

X 

15 

16 

18 

14 

15 

17 

96 

Y 

8,6 

7,5 

6,7 

6,5 

8,2 

4,7 

42,2 

Linea 

B 

C 

D 

E 

F 

A 


X 

16 

15 

16 

19 

21 

14 

101 

Y 

7,6 

8,2 

8,3 

4,6 

5,2 

6,5 

40,4 

Linea 

C 

D 

E 

F 

A 

B 


X 

15 

16 

16 

19 

15 

17 

98 

Y 

5,7 

9,6 

7,1 

4,8 

7,5 

7,5 

42,2 

Linea 

D 

E 

F 

A 

B 

C 


X 

18 

18 

20 

18 

22 

17 

113 

Y 

8,3 

5,3 

10,0 

6,8 

7,8 

6,6 

44,8 

Linea 

E 

F 

A 

B 

C 

D 


X 

15 

18 

19 

16 

16 

15 

99 

Y 

8,3 

7,9 

5,4 

9,3 

4,8 

8,0 

43,7 

Linea 

F 

A 

B 

C 

D 

E 


X 

18 

20 

19 

17 

17 

15 

106 

Y 

5,7 

8,7 

8,1 

6,1 

7,2 

7,4 

43,2 

X 

100 

103 

108 

103 

106 

95 

615 

Y 

44,2 

47,2 45,6 38,1 40,7 

TOTALES DE TRATAMIENTOS 

40,7 

256,5 

Linea 

A 

B 

C 

D 

E 

F 


X 

102 

98 

102 

100 

101 

112 


Y 

42,5 

49,3 

42,5 

45,7 

45,4 

31,1 
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PrimerPaso: 


Sumas de productos y Sumas de Cuadrados 
Suma de Productos para el total: 

SPTotal = [(18x8,6)+...+(15x 7,4)1-- ^ 615x256,5 - > = -10175 

1 36 

Suma de Productos para Filas: 

SPFilas - ^[(98x42,2)+...+(106x43,2)] - F.C.= 4708 
Suma de Productos de Columnas: 

SPCol = -^[(100x44,2)+...+(95x40,7)] - F.C = 3358 
Suma de Productos para tratamientos 
SPTrat = / 6 [( 102x42,5)+.. ,+(l 12x3 l,l)] -F.C.= -25208 
-. Suma de productos para el error 

SPEE = SPTotal- SPRep- SPTrat = -10175- 4708 - 3358 - (-25208) = 6967 


Con estos datos se construye la tabla siguiente: 


F.deV. 

G. de L. 

SCX 

SPXY 

SCY 

Total 

35 

134750 

-10175 

73260 

Filas 

5 

29503 

4708 

1906 

Columnas 

5 

17583 

3358 

10010 

Tratamientos (T) 

5 

19917 

-25208 

32413 

Error (E) 

20 

67677 

6967 

28939 

T + E 

25 

87594 

-18241 

61352 
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32413/5 6482,60 

F =-=-— = 448** 

’ 28939/20 1446,95 

19917/5 3983,40 

F * ~ 67677/20 “ 3383,85 ~ 

F lab = 2,71 Y 4,10. 

El análisis sin ajuste por covariable indica que hay diferencias entre las medias 
de los tratamientos (se rechaza Ho), pero no hay diferencias entre las medias 
correspondientes a número de plantas (no se rechaza Ho). 

Segundopdso: 

Prueba de significación para regresión: 


F.deV. 

G.deL. 

S.deC. 

C.M. F 

Regresión 

1 

717,22 

717,22 < 1 

Desv. de Reg. 

19 

28221,78 

1185,36 

Residual 

20 




Suma de Cuadrados para efecto de regresión 

(SPXY E ) 2 Í6967 2 ) 

SCReg - E/ V ' 


SCX c 


67677 


= 717,22 


Suma de cuadrados para desviaciones desde la regresión 


SC D = SCY e - SCR = 28939,00 - 717,22 = 28221,78 

En este caso no hay influencia notable del número de plantas (X) sobre el 
rendimiento (Y); es decir, no hay regresión de Y sobre X, por lo tanto no se 
requiere ajustar tratamientos. En consecuencia el resto del análisis se hace con los 
rendimientos iniciales (sin ajustar). 
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TercerPaso: 

Prueba de significación para tratamientos ajustados. 

Se procede de la misma manera que en los casos anteriores, esto se haría si 
el análisis anterior lo hubiese indicado necesario. 


Cuarto paso. Ajuste de medias: 

Se procede igual que en los casos anteriores usando el modelo: 

Y-J3 (X i -X..) = J u+T í + s ¡ 

tomando el lado izquierdo de la igualdad como rendimiento libre del efecto de 
X y generalizando, entonces, 

Y, =Y-b(X-X..) 


Quintopaso: 

Comparación de medias ajustadas. 

Se procede igual que en los casos anteriores, usando la expresión: 
Sd 


CME' 


2 . (X,-X 2 ) 2 


—+ 
r 


SCX c 
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TÉCNICA PARA LA PARCELA FALTANTE 

En muchos experimentos debido a situaciones inesperadas pueden perderse 
una o varias unidades experimentales. Tales perturbaciones pueden ocurrir debido 
a muchas razones tales como, aguachinamiento de la parcela, enfermedades, plagas, 
muerte de los animales que constituyen la unidad experimental, etc. 

Existen métodos desarrollados para analizar datos bajo estas situaciones 
pero generalmente estos métodos son complicados. Existe otra serie de métodos 
más sencillos que permiten estimar el valor de la parcela perdida y realizar los 
análisis sin que se pierda el grado de balanceo o simetría de los procedimientos 
analíticos. 


Lasituaciónqueoarrr^ trufafrecumtementeesaqudLenlaquefidtaunaobsermáón, 

En este caso se debe emplear un método que permita estimar un valor que 
reemplace a la observación faltante y después proceder con el análisis usual. El 
procedimiento de estimación de la observación faltante, comúnmente usado por 
los estadísticos consiste en asignar aquel valor de la observación faltante que reduzca 
la suma de cuadrados del error experimental cuando se efectúa el análisis de 
varianza. Desde el punto de vista matemático este resulta ser un problema que se 
resuelve mediante el cálculo diferencial representando como OF a la observación 
faltante, calculando la expresión algebraica de la suma de cuadrados del error 
experimental, derivando esta ecuación con respecto a OF e igualando a cero 
para obtener una solución. 

El procedimiento puede resumirse a la siguiente fórmula, la cual proporciona 
una estimación de la observación faltante de acuerdo con el principio anterior. 


OF = 


tT+ bB- S 
(t- l)(b-1) 


(13.1) 
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t = número de tratamientos, 
b = número de bloques. 

T = suma de observaciones con el mismo tratamiento como la 
observación faltante. 

B = suma de observaciones con el mismo bloque como la observación 
faltante. 

S = suma de todas las observaciones reales. 

Este valor de OF se anota posteriormente en el sitio adecuado en la tabla de 
datos y los datos se analizan en la forma acostumbrada, tomando en cuenta que 
el error experimental pierde un grado de libertad debido a la estimación de la 
observación perdida, por consiguiente los grados de libertad para el error 
experimental en un diseño en bloques al azar serán (t - l)(b -1) -1 y los grados de 
libertad para el total son (bt - 2). 

El segundo cambio es un poco más complicado de aplicar. Antes de detallar 
este cambio es necesario que se discuta que es y porque es necesario. Puede 
demostrarse que bajo la hipótesis nula, el valor esperado de SCTrat/(t-1); es 
decir, el cuadrado medio de tratamiento, calculado a partir de los datos 
aumentados es mayor que s 2 , el cuadrado medio del Error Experimental. Si esto 
es así, cualquier prueba de hipótesis que sea correcta pero que sea hecha de esta 
forma, será una prueba sesgada y a lo sumo puede ser considerada aproximada. 
La corrección de estos sesgos, el segundo cambio mencionado anteriormente, 
consiste en disminuir la suma de cuadrados de tratamiento en la cantidad: 


ÍB - (t -1 )of] 2 

Corrección por sesgo = S =--—— 

t(t-l) 


(13.2) 


Por lo tanto la nueva suma de cuadrados de tratamientos será 
SCTrat' = SCTrat-S e 

y finalmente se obtiene el Análisis de Varianza siguiente: 
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ANA.VAR 


F.deV. 

G. de L. 

SC 

CM 

F 

Trat 

t- 1 

SCTrat' 

CMtrat' 

CMTtrat' / CMEE 

Bloque 

b- 1 

SCBloq 

CMBloq 


EE 

(M)(b-1)-1 

SCEE 

CMEE 


Total 

bt-2 

SCTotal 




Ejemplo práctico sobre técnicas para parcelas faltantes 

Tabla 13.4. Datos sobre un experimento realizado con seis variedades de 
Soya con cuatro repeticiones en un Diseño Experimental en Bloques. Los datos 
están dados en Kg-parcela. 


TRATAMIENTOS 


REP 

1 

2 

3 

4 

5 

6 

Totales 

I 

24 

23 

28 


30 

41 

146 

II 

18 

17 

17 

19 

19 

18 

108 

II 

41 

41 

49 

39 

19 

18 

207 

IV 

46 

69 

74 

58 

54 

59 

360 

Totales 

129 

150 

168 

116 

122 

136 

821 


Estimación de la parcela faltante 


tT+ bB-S 
(t-l)(b-l) 


6(116)+ 4(146)-821 
5x3 


= 30,6 


La corrección por sesgos en la suma de cuadrados de tratamiento sería 
entonces: 
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n . c [B - (t - 1)0F] 2 [l46-5x30,6] 2 

Corrección por sesgo = S e = i -— = - -= 1,63 

t(t-l) 6x5 


Cuando faltan dos o mas valores: 

Puede seguirse el mismo procedimiento general, usando el cálculo para 
obtener estimaciones. Se pueden calcular también las estimaciones a través de 
métodos iterativos que proporcionen resultados equivalentes. Supóngase que faltan 
dos valores; para uno de ellos se sustituye la media de todas las observaciones 
registradas y luego se estima el segundo valor faltante usando la ecuación (13.1). 
Coloque esa estimación en su lugar adecuado de la tabla, lleve la media general de 
su posición al lugar de la primera observación faltante y después estime un valor 
de la primera observación faltante usando de nuevo la ecuación (13-1). 
Aproximadamente después de dos ciclos se encontrará muy poco o ning ún cambio 
entre dos estimaciones sucesivas del mismo valor faltante. Al llegar a este punto 
se tienen los valores estimados definitivos. Este procedimiento puede generalizarse 
fácilmente a casos en los que falten tres o más observaciones. 

Sin embargo hay otros cambios que son necesarios, ante todo se deben 
reducir los grados de libertad asociados con el error experimental como con el 
total, en el número de observaciones estimadas. También debe reducirse la S uma 
de Cuadrados de Tratamiento en una cantidad especificada a fin de corregir por 
los sesgos incorporados por el procedimiento. Si se tienen dos observaciones 
faltantes (no en el mismo bloque) la corrección necesaria para los sesgos viene 
dada por: 

^ . n [B'-(t-l)OF'] 2 +[B"-(t-l)OF"] 2 

t(t-l) 
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OF' = Primera observación faltante. 

OF '' = Segunda observación faltante. 

B' = total de las observaciones en el mismo bloque en que se presenta la primera 
observación faltante. 

B'' = total de las observaciones en el mismo bloque en que se presenta la segunda 
observación faltante. 


Aplicación de la Covarianza en la estimación de datos faltantes 

Para usar el análisis de covarianza para estimar datos faltantes se supone una 
variable X relacionada con otra Y, los valores de X son ceros para todos los 
valores presentes y -1 para el faltante, para la variable Y se coloca 0 en el par de 
datos faltante y se colocan los valores reales en los demás casos. Las sumas de 
productos y las sumas de cuadrados se calculan de la forma convencional y 
finalmente trabajando con los datos del Error Experimental se calcula el coeficiente 
b, ignorando el signo de la suma de productos; este valor representa el valor 
estimado del dato faltante. 

Suponga un diseño en bloques al azar con un valor perdido: parcela del 
tratamiento A en la repetición LH. Tabla 13.5. 
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Tabla 13.5. Datos de ejercicio de aplicación de covarianza 

para la estimación de 

datos faltantes 













REPETICIONES 




Trata- 

I 



II 


m 


IV 

V 

mientos 

X 

Y 

X 

Y 

X 

Y 

X 

Y 

Totales 

A 

0 

6 

0 

7 

-1 

0 

0 

9 

-1 22 

B 

0 

2 

0 

5 

0 

4 

0 

5 

0 12 

C 

0 

8 

0 

7 

0 

9 

0 

6 

0 30 

D 

0 

3 

0 

7 

0 

5 

0 

5 

0 20 


0 

19 

0 

26 

-1 

18 

0 

25 

-1 84 


ANAVAR YANCOVA 


F. de V. 

G. de L. 

SCX 

SPXY 

SCY 

Total 

15 

1-(1/16) -15/16 

5,37 

27,75 

Rep. 

3 

(l/4)-(l/16) — 3/16 

0,87 

9,25 

Trat. 

3 

(l/4)-(l/16) — 3/16 

-0,12 

18,75 

Error 

9 

9/16 

4,51 

59,75 

T + E 

12 


4,39 

79,50 


El dato faltante es obtenido; 


spxy e 

b =-- 

SCX E 


4,51 

9/16 


= 8,1 


Este sería el valor estimado de Y correspondiente a la parcela del tratamiento 
A en la repetición IEL 


A continuación se mostrará otro ejemplo correspondiente a los datos de 
contenido de ácido ascórbico en miligramos por 100 grs. de peso seco en tres 
variedades de vainita. 


332 



Diseño y Análisis de Experimentos 13 


-Tabla 13.6. Datos de otro ejercicio de aplicación 
de datos faltantes. 

de covarianza para 

la estimación 




REPETICIONES 






Trata- 


I 


II 

III 


IV 


V 

mientos 

X 

Y 

X 

Y 

X 

Y 

X 

Y 

X 

Y 

A 

-1 

0 

0 

887 

0 

897 

0 

850 

0 

975 

B 

0 

857 

0 

1189 

0 

918 

0 

968 

0 

909 

C 

0 

917 

0 

1072 

0 

975 

0 

930 

0 

954 


-1 

1774 

0 

3148 

0 

2790 

0 

2748 

0 

2838 


ANAVAR Y ANCOVA 

F. de V. 

G. de L. 

scx 

SPXY 

SCY 

Total 

14 

1-(1/15) = 14/15 

-886,53 

945,296 

Rep. 

4 

(l/3)-(l/15) = 4/15 

-295,20 

359,823 

Trat. 

2 

(l/5)-(l/15)=2/15 

-164,73 

206,533 

Error 

8 

8/15 

-426,60 

381,940 

T + E 

10 


-591,33 

1893,592 


La estimación del dato faltante es obtenido y su valor se calcula de la siguiente 
manera: 


spxy e 

b =-- 

SCX E 


426,60 

8/15 


= 800 
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Tabla A: Valores del estadístico de Wilk y shapiro 


n 

0.01 

0.02 

0.05 

0.10 

0.50 

0.90 


0.98 

0.99 

3 

0.753 

0.756 

0.767 0.789 

0.959 

0.998 

0.999 

1.000 

1.000 

4 

.687 

.707 

.748 

.792 

.935 

.987 

.992 

.996 

.997 

5 

.686 

.715 

.762 

.806 

.927 

.979 

.986 

.991 

.993 

6 

.713 

0.743 

0.788 

0.826 

0.927 

0.974 

0.981 

0.986 

0.989 

7 

.730 

.760 

.803 

.838 

.928 

.972 

.979 

.985 

.988 

8 

.749 

.778 

.818 

.851 

.932 

.972 

.978 

.984 

.987 

9 

.764 

.791 

.829 

.859 

.935 

.972 

.978 

.984 

.986 

10 

.781 

.806 

.842 

.869 

.938 

.972 

.978 

.983 

.986 

11 

0.792 

0.817 

0.850 

0.876 

0.940 

0.973 

0.979 

0.984 

0.986 

12 

.805 

.828 

.859 

.833 

.943 

.973 

.979 

.984 

.986 

13 

.814 

.937 

.866 

.889 

.945 

.974 

.979 

.984 

.986 

14 

.825 

.846 

.874 

.895 

.947 

.975 

.980 

.984 

.986 

15 

.835 

.855 

.881 

.901 

.950 

.975 

.980 

.984 

.987 

16 

0.844 

0.863 

0.887 

0.906 

0.952 

0.976 

0.981 

0.985 

0.987 

17 

.851 

.869 

.892 

.910 

.954 

.977 

.981 

.985 

.987 

18 

.858 

.874 

.897 

.914 

.956 

.978 

.982 

.986 

.988 

19 

.863 

.879 

.901 

.917 

.957 

.978 

.982 

.986 

.988 

20 

.868 

.884 

.905 

.920 

.959 

.979 

.983 

.986 

.988 

21 

0.873 

0.888 

0.908 

0.923 

.960 

0.980 

0.983 

0.987 

0.989 

22 

.878 

.892 

.911 

.926 

.961 

.980 

.984 

.987 

.989 

23 

.881 

.895 

.914 

.928 

.962 

.981 

.984 

.987 

.989 

24 

.884 

.898 

.916 

.930 

.963 

.981 

.984 

.987 

.989 

25 

.888 

901 

.918 

.931 

.964 

.981 

.985 

.988 

.989 

26 

0.891 

0.904 

0.920 

0.933 

0.965 

0.982 

0.985 

0.988 

0.989 

27 

.894 

.906 

.923 

.935 

.965 

.982 

.985 

.988 

.990 

28 

.896 

.908 

.924 

.936 

.966 

.982 

.985 

.988 

.990 

29 

.898 

.910 

.926 

.937 

.966 

.982 

.985 

.988 

.990 

30 

.900 

.912 

.927 

.939 

.967 

.983 

.985 

.988 

.900 

31 

0.902 

0.914 

0.929 

0.940 

0.967 

0,983 

0.986 

0.988 

0.990 

32 

.904 

.915 

.930 

.941 

.968 

.983 

.986 

.988 

.990 

33 

.906 

.917 

.931 

.942 

.968 

.983 

.986 

.989 

.990 

34 

.908 

.919 

.933 

.943 

.969 

.983 

.986 

.989 

.990 

35 

.910 

.920 

.934 

.944 

.969 

.984 

.986 

.989 

.990 

36 

0.912 

0.922 

0.935 

0.945 

0.970 

0.984 

0.986 

0.989 

0.990 

37 

.914 

.924 

.936 

.946 

.970 

.984 

.987 

.989 

.990 

38 

.916 

.925 

.938 

.947 

.971 

.984 

.987 

.989 

.990 

39 

.917 

.927 

.939 

.948 

.971 

.984 

.987 

.989 

.991 

40 

.919 

.928 

.940 

.949 

.972 

.985 

.987 

.989 

.991 

41 

0.920 

0.929 

0941 

0.950 

9.972 

0.985 

0.987 

0.989 

0.991 

42 

.922 

.930 

.942 

.951 

.972 

.985 

.987 

.989 

.991 

43 

.923 

.932 

.943 

.951 

.973 

.985 

.987 

.990 

.991 

44 

.924 

.933 

.944 

.952 

.973 

.985 

.987 

.990 

.991 

45 

.926 

.934 

.945 

.953 

.973 

.985 

.988 

.990 

.991 

46 

0.927 

0.935 

0.945 

0.953 

0.974 

0.985 

0.988 

0.990 

0.991 

47 

.928 

.936 

.946 

.954 

.974 

.985 

.988 

.990 

.991 

48 

.929 

.937 

.947 

.954 

.974 

.985 

.988 

.990 

.991 

49 

.929 

.937 

.947 

.955 

.974 

.985 

.988 

.990 

.991 

50 

.930 

.938 

.947 

.955 

.974 

.985 

.988 

.990 

.991 




Tabla B: Valores del estadístico para la Prueba de Cochran a un nivel de significación del 5% 


A" 

2 

3 

4 

5 

2 

0.9985 

0.9750 

0.9392 

0.9057 

3 

0.9669 

0.8709 

0.7977 

0.7457 

4 

0.9065 

0.7679 

0.6841 

0.6287 

5 

0.8412 

ü.6838 

0.5981 

0.5441 

6 

0.7808 

0.6161 

0.5321 

0.4803 

7 

0.7271 

0.5612 

0.4800 

0.4307 

8 

0.6798 

0.5157 

0.4377 

0.3910 

9 

0.6385 

0.4775 

0.4027 

0.3584 

10 

0.6020 

0.4450 

0.3733 

0.3311 

12 

0.5410 

0.3924 

0.3264 

0.2880 

15 

0.4709 

0.3346 

0.2758 

0.2419 

20 

0.3894 

0.2705 

0.2205 

0.1921 

24 

0.3434 

0.2354 

0.1907 

0.1656 

30 

0.2929 

0.1980 

0.1593 

0.1377 

40 

0.2370 

0.1576 

0.1259 

0.1082 

60 

0.1737 

0.1131 

0.0895 

0.0765 

120 

0.0998 

0.0632 

0.0495 

0.0419 

oc 

0 

0 

0 

0 


6 

7 

8 

9 

10 

0.8772 

0.8534 

0.8332 

08159 

0.8010 

0.7071 

0.6771 

0.6530 

0.6333 

0.6167 

0.5895 

05598 

0.5365 

0.5175 

0.5017 

0.5065 

0.4783 

0.4564 

0.4387 

0.424 1 

0.4447 

0.4184 

0.3980 

0.3817 

0.3682 

0.3974 

0..3726 

0.3535 

0.3384 

0.3259 

0.3595 

0..3362 

0.3185 

0.3043 

0.2926 

0.3286 

0.3067 

0.2901 

0.2768 

0.2659 

0.3029 

0.2823 

0.2666 

0.2541 

0.2439 

0.2624 

0.2439 

0.2299 

0.2187 

0.2098 

0.2195 

0.2034 

0.1911 

0.1815 

0.1736 

0.1735 

0.1602 

0.1501 

0.1422 

0.1357 

0.1493 

0.1374 

0.1286 

0.1216 

0.1160 

0.1237 

0.1137 

0.1061 

0.1002 

0.0958 

0.0968 

0.0887 

0.0827 

0.780 

0.0745 

0.0682 

0.0623 

0.0583 

0.0552 

0.0520 

0.0371 

0.0337 

0.0312 

0.0292 

0.0279 

0 

0 

0 

0 

0 


11 17 37 145 X 


0.7880 

0.7341 

0.6602 

0.5813 

0.5000 

0.6025 

0.5466 

0.4748 

0.4031 

0.3333 

0.4884 

0.4366 

0.3720 

0.3093 

0.2500 

0.4118 

0.3645 

0.3066 

0.2513 

0.2000 

0.3568 

0.3135 

0.2612 

0.2119 

0.1667 

0.3154 

0.2756 

0.2278 

0.1833 

0.1429 

0.2829 

0.2462 

0.2022 

0.1616 

0.1250 

0.2568 

0.2226 

0.1820 

0.0446 

0.1111 

0.2353 

0.2032 

0.1655 

0.1308 

0.1000 

0.2020 

0.1737 

0.1403 

0.1100 

0.0833 

0.1671 

0.1429 

0.1144 

0.0889 

C.0667 

0.1303 

0.1108 

0.0879 

0.0675 

0.0500 

0.1113 

0.0942 

0.0743 

0.0567 

0.0417 

0.0921 

0.0771 

0.0604 

0.0457 

0.0333 

0.0713 

0.0595 

0.0462 

0.0347 

0.0250 

0.0497 

0.0411 

0.0316 

0.0234 

0.0167 

0.0266 

0.0218 

0.0165 

0.0120 

0.0083 

0 


0 

0 

0 


Tabla C: Valores del estadístico para la Prueba de Cochran a un nivel de significación del 1% 


\ n 

AL 

2 

3 

4 

5 

6 

7 

8 

9 

10 

2 

0.999 

0.9950 

0.9794 

0.9586 

0.9373 

0.9172 

0.8988 

0.8823 

0.8674 

3 

0.9933 

0.9423 

0.8831 

0.8335 

0.7933 

0.7606 

0.7335 

0.7117 

0.6912 

4 

0.9676 

0.8643 

0.7814 

0.7212 

0.6761 

0.6410 

0.6129 

0.5897 

0.5702 

5 

0.9279 

0.7885 

0.6957 

0.6329 

0.5875 

0.5531 

0.5259 

0.5037 

0.4854 

6 

0.8828 

0.7218 

0.6258 

0.5635 

0-5195 

0.4866 

0.4608 

0.4401 

0.4229 

7 

0.8376 

0.6644 

0.5685 

0.5080 

0.4659 

0.4347 

0.4105 

0.3911 

0.3751 

8 

0.7945 

0.6142 

0.5209 

0.4627 

0.4226 

0..3932 

0.3704 

0.3522 

0.3373 

9 

0.7544 

0.5727 

0.4810 

0.4251 

0.3870 

0.3592 

0.3378 

0.3207 

0.3067 

10 

0.7175 

0.5358 

0.4469 

0.3934 

0.3872 

0.3308 

0.3106 

0.2945 i 

0.2813 

12 

0.6528 

0.4751 

0.3919 

0.3428 

0.3099 

0.2861 

0.2680 

0.2525 

0.2419 

15 

0.5747 

0.4069 

0.3317 

0.2882 

0.2593 

0.2386 

0.2228 

0.2104 

0.2002 

20 

0.4799 

0.3297 

0.2654 

0.2288 

0.2048 

0.1877 

0.1748 

0.1646 

0.1567 

24 

0.4247 

0.2871 

0.2295 

0.1970 

0.1759 

0.1608 

0.1495 

0.1406 

0.1338 

30 

0.3632 

0.2412 

0.1913 

0.1635 

0.1454 

0.1327 

0.1232 

0.1157 

0.1100 

40 

0.2940 

0.1915 

0.1508 

0.1281 

0.1135 

0.1033 

0.0957 

0.0898 

0.0853 

60 

0.2151 

0.1371 

0.1069 

0.0902 

0.0796 

0.0722 

0.0668 

0.0625 

0.0594 

120 

0.1225 

0.0759 

0.0585 

0.0489 

0.0429 

0.0387 

0.0357 

0.0334 

0.0316 


0 

0 

0 

0 

0 

0 

0 

0 

0 


11 


0.8539 

0.6743 

0.5536 

0.4697 

0.4084 

0.3616 

0.3248 

0.2950 

0.2704 

0.2320 

0.1918 

0.1501 

0.1283 

0.1054 

0.0816 

0.0567 

0.0302 

0 
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0.7949 

0.6059 

0.4884 


0.7067 

0.5153 

0.4057 


0.4094 

0.3529 

0.3105 


0.3351 

0.2858 

0.2494 


0.2779 

0.2514 

0.2297 


0.2214 

0.1992 

0.1811 


0.1961 

0.1612 

0.1248 


0.1535 

0.1251 

0.0960 


0.1060 

0.0867 

0.0868 


0.0810 

0.0658 

0.0503 


0.0461 0.0344 
0.0242 0.0178 
0 


145 


0.6062 

0.4230 

0.3251 

0.2644 

0.2229 

0.1929 

0.1700 

0.1521 

0.1376 

0.1157 

0.0934 

0.0709 

0.0595 

0.0480 

0.0363 

0.0245 

0.0125 

0 


X | 


0.5000 

0.3333 

0.2500 

0.2000 

0.1667 

0.1429 

0.1250 

0.1111 

0.1000 

0.0833 

0.0667 

0.0500 

0.0417 

0.0333 

0.0250 

0.0167 

0.0083 

0 
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Tabla D: Valores del estadístico de Pearson y Hartley a un nivel de significación del 5 % 




































Tabla F: Puntos porcentuales superiores de la amplitud studentizada q a = ( Y ^ - Y min )/S-) 
_ p = número de medias de tratamiento 


5 .05 3.64 4.60 5.22 5.67 

.01 5.70 6.97 7.80 8.42 

6 .05 3.46 4.34 4.90 5.31 

-01 5.24 6.33 7.03 7.56 

7 .05 3.34 4.16 4.68 5.06 

.01 4.95 5.92 6.54 7.01 

8 .05 3.26 4.04 4.53 4.89 

.01 4.74 5.63 6.20 6.63 

9 .05 3.20 3.95 4.442 4.76 

.01 4.60 5.43 5.96 6-35 

10 .05 3.15 3.88 4.33 4.65 

.01 4.48 5.27 5.77 6.14 

11 .05 3.11 3.82 4.26 4.57 

.01 4.39 5.14 5.62 5.97 

12 .05 3.08 3.77 4.20 4.51 

.01 4.32 5.04 5.50 5.84 

13 .05 3.06 3.73 4.15 4.45 

.01 4.26 4.96 5.40 7.73 

14 .05 3.03 3.70 4.11 4-4| 

.01 4.21 4.89 5.32 5.63 

15 .05 3.01 3.67 4.08 4.37 

.01 4.17 4.83 5.25 5.56 

16 .05 3.00 3.65 4.05 4.33 

.01 4.13 4.78 5.19 5.49 

17 .05 Z98 3.63 4.02 4.30 

.01 4.10 4.74 5.14 5.43 

18 .05 2.97 3.61 4.00 4.28 

.01 4.07 4.70 5.09 5.38 

19 .05 2.96 3.59 3.98 4.25 

-01 4.05 4.67 5.05 5.33 

20 .05 2.95 3.58 3.96 4.23 

.01 4.02 4.64 5.02 5.29 

24 .05 2.92 3.53 3 90 4.17 

.01 3.96 4.54 4.91 5.17 

30 .05 2.89 3.49 3 84 4.10 

.01 3.89 4.45 4.80 5.05 

40 .05 2.86 3.44 3.79 4.04 

.01 3.82 4.37 4.70 4.93 

60 .05 2.83 3.40 3.74 3.98 

.01 3.76 4.28 4.60 4.82 

120 .05 2.80 3.36 3.69 3.92 

.01 3.70 4.20 4.50 4.71 

ao 05 2.77 3.31 3.63 3.86 

.01 3.64 4.12 4.40 4.60 


6.03 6.33 6.58 6.80 6.99 7.17 

8.91 9.32 9.67 9.97 10.24 10.48 

5.63 5.89 6.12 6.32 6.49 6.65 

7.97 8.32 8.61 8.87 9-10 9.30 

5.36 5.61 5.82 6.00 6.16 6.30 

7.37 7.68 7.94 8.17 8.37 8.55 

5.17 5.40 5.60 5.77 5.92 6.05 

6.96 7.24 7.47 7.68 7.87 8.03 

5.02 5.24 5.43 5.60 5.74 8.87 

6.66 6.91 7.13 7.32 7.49 7.65 

4.91 5.12 5.30 5.46 5.60 5.72 

6.43 6.67 6.87 7.05 7.21 7.36 

482 5.03 5.20 5 3 5 5.49 5.61 

6.25 6.48 6.67 6.84 6.99 7.13 

4.75 4.95 5.12 5.27 5.40 5.51 

6.10 6.32 6.51 6.67 6.81 6.94 

4.69 4.88 5.05 5.19 5.32 5.43 

5.98 6.19 6.37 6.53 6.67 6.79 

4.64 4.83 4.99 5.13 5.25 5.36 

5.88 6.08 6.26 6.4 | 6.54 6.66 

4.60 4.78 4.94 5.08 5.20 5.31 

5.80 5,99 6.16 6.31 6.44 6.55 

4.56 4.74 4,90 5.03 5.15 5.26 

5.72 5.92 6.08 6.22 6.35 6.46 

4.52 4.71 4.86 4.99 5.11 5.21 

5.66 5.85 6.01 6.15 6.27 6.38 

4.49 4.67 4.82 4.96 5.07 5.17 

5.60 5.79 5.94 6.08 6.20 6.31 

4.47 4.65 4.79 4.92 5.04 5.14 

5.55 5.73 5.89 6.02 6.14 6.25 

4.45 4.62 4.77 4.90 5.01 5.11 

5-51 5.69 5.84 5.97 6.09 6.19 

4.37 4.54 4.68 4.81 4.92 5.01 

5.37 5.54 5.69 5.81 5.92 6.02 

4.30 4.46 4.60 4.72 4.83 4.92 

5.24 5.40 5.54 5.65 5.76 5.85 

4.23 4.39 4.54 4.63 4.74 4.82 

5.11 5.27 5.39 5.50 5.60 5.69 

4.16 4.31 4.44 4.55 4.65 4.73 

4.99 5.13 5.25 5.36 5.45 5.53 

4.10 4.24 4.36 4.48 4.56 4.64 

4.87 5.01 5.12 5.21 5.30 5.38 

4.03 4.17 4.29 4.39 4.47 4.55 

4.76 4.88 4.99 5.08 5.16 5.23 


Tabla F: Puntos porcentuales superiores de la amplitud studentizada q a = (Y^ -Y mtn )l S¿) (continuación) 


12 

13 

14 

15 

16 

17 

18 

19 

20 

a 

gl del error 

7.32 

7.47 

7.60 

7.72 

7.83 

7.93 

8.03 

8.12 

8.21 

.05 

5 

10.70 

10.89 

11.08 

11.24 

11.40 

11.55 

11.68 

11.81 

11.93 

.01 


6.79 

6.92 

7.03 

7.14 

7.24 

7.34 

7.43 

7.51 

7.59 

.05 

6 

9.49 

9.65 

9.81 

9.95 

10.08 

10.21 

10.32 

10.43 

10.54 

.01 


6.43 

6.55 

6.66 

6.76 

6.85 

6.94 

7.02 

7.09 

7.17 

.05 

7 

8.71 

8.86 

9.00 

9.12 

9.24 

9.35 

9.46 

9.55 

9.65 

.01 


6.18 

6.29 

6.39 

6.48 

6.57 

6.65 

6.73 

6.80 

6.87 

.05 

8 

8.18 

8.31 

8.44 

8.55 

8.66 

8.76 

8.85 

8.94 

9.03 

.01 


5.98 

6.09 

6.19 

6.28 

6.36 

6.44 

6.51 

6.58 

6.64 

.05 

9 

7.78 

7.91 

8.03 

8.13 

8.23 

8.32 

8.41 

8.49 

8.57 

.01 


5.83 

5.93 

6.03 

6.11 

6.20 

6.27 

6.34 

6.40 

6.47 

.05 

10 

7.48 

7.60 

7.71 

7.81 

7.91 

7.99 

8.07 

8.15 

8.22 

.01 


5.71 

5.81 

5.90 

5.99 

6.06 

6.14 

6.20 

6.26 

6.33 

.05 

11 

7.25 

7.36 

4.46 

7.56 

7.65 

7.73 

7.81 

7.88 

7.95 

.01 


5.62 

5.71 

5.80 

5.88 

5.95 

6.03 

6.09 

6.15 

6.21 

.05 

12 

7.06 

7.17 

7.26 

7.36 

7.44 

7.52 

7.59 

7.66 

7.73 

.01 


5.53 

5.63 

5.71 

5.79 

5.86 

5.93 

6.00 

6.05 

6.11 

.05 

13 

6.90 

7.01 

7.10 

7.19 

7.27 

7.34 

7.42 

7.48 

7.55 

.01 


5.46 

5.55 

5.64 

5.72 

5.79 

5.85 

5.92 

5.97 

6.03 

.05 

14 

6.77 

6.87 

6.96 

7.05 

7.12 

7.20 

7.27 

7.33 

7.39 

.01 


5.40 

5.49 

5.58 

5.65 

5.72 

5.79 

5.85 

5.90 

5.96 

.05 

15 

6.66 

6.76 

6.84 

6.93 

7.00 

7.07 

7.14 

7.20 

7.26 

.01 


5.35 

5.44 

5.52 

5.59 

5.66 

5.72 

5.79 

5.84 

5.90 

.05 

16 

5.56 

6.66 

6.74 

6.82 

6.90 

6.97 

7.03 

7.09 

7.15 

.01 


5.31 

5.39 

5.47 

5.55 

5.61 

5.68 

5.74 

5.79 

5.84 

.05 

17 

Ó.48 

6.57 

6.66 

6.73 

6.80 

6.87 

6.94 

7.00 

7.05 

.01 


5.27 

5.35 

5.43 

5.50 

5.57 

5.63 

5.69 

5.74 

5.79 

.05 

18 

6.41 

6.50 

6.58 

6.65 

6.72 

6.79 

6.85 

6.91 

6.96 

.01 


5.23 

5.32 

5.39 

5.46 

5.53 

5.59 

5.65 

5.70 

5.75 

.05 

19 

6.34 

6.43 

6.51 

6.58 

6.65 

6.72 

6.78 

6.84 

6.89 

.01 


5.20 

5.28 

5.36 

5.43 

5.49 

5.55 

5.61 

5.66 

5.71 

.05 

20 

6.29 

6.37 

6.45 

6.52 

6.59 

6.65 

6.71 

6.76 

6.82 

.01 


5.10 

5.18 

5.25 

5.32 

5.38 

5.44 

5.50 

5.54 

5.59 

.05 

24 

6.11 

6.19 

6.26 

6.33 

6.39 

6.45 

6.51 

6.56 

6.61 

.01 


5.00 

5.08 

5.15 

5.21 

5.27 

5.33 

5.38 

5.43 

5.48 

.05 

30 

5.93 

6.01 

6.08 

6.14 

6.20 

6.26 

6.31 

6.36 

6.41 

.01 


4.91 

4.98 

5.05 

5.11 

5.16 

5.22 

5.27 

5.31 

5.36 

.05 

40 

5.77 

5.84 

5.90 

5.96 

6.02 

6.07 

6.12 

6.17 

6.21 

.01 


4.81 

4.88 

4.94 

5.00 

5.06 

5.11 

5.16 

5.20 

5.24 

.05 

60 

5.60 

5.67 

5.73 

5.79 

5.84 

5.89 

5.93 

5.98 

6.02 

.01 


4.72 

4.78 

4.84 

4.90 

4.95 

5.00 

5.05 

5.09 

5.13 

.05 

120 

5.44 

5.51 

5.56 

5.61 

5.66 

5.71 

5.75 

5.79 

5.83 

.01 


4.62 

4.68 

4.74 

4.80 

4 «5 

4.89 

4.93 

4.97 

5.01 

.05 


5.29 

5.35 

5.40 

5.45 

5.49 

5.54 

5.57 

5.61 

5.65 

.01 




Tabla G Amplitudes studentizadas significativas para 5 y 1 por ciento de la nueva prueba de 
amplitud múltiple 


gl del Nivel p = numero de medias para la amplitud a probarse 

error significativo__ 




2 

3 

4 

5 

6 

7 

8 

9 

10 

12 

14 

16 

18 

?0 

1 

.05 

18.0 

18.0 

18.0 

18.0 

18.0 

18.0 

18.0 

18.0 

18.0 

18.0 

18.0 

18.0 

18.0 

18.0 


.01 

90.0 

90.0 

90.0 

90.0 

90.0 

90.0 

90.0 

90.0 

90.0 

90.0 

90.0 

90.0 

90.0 

90.0 

2 

.05 

6.09 

6.09 

6.09 

6.09 

6.09 

6.09 

6.09 

6.09 

6.09 

6.09 

6.09 

6.09 

6.09 

6.09 


.01 

14.0 

14.0 

14.0 

14.0 

14.0 

14.0 

14.0 

14.0 

14.0 

14.0 

14.0 

14.0 

14.0 

14.0 

3 

.05 

4.50 

4.50 

4.50 

4.50 

4.50 

4.50 

4.50 

4.50 

4.50 

4.50 

4.50 

4.50 

4.50 

4.50 


.01 

8.26 

8.3 

8.6 

8.7 

8.8 

8.9 

8.9 

9.0 

9.0 

9.0 

9.1 

9.2 

9.3 

9.3 

4 

.05 

3.93 

4.01 

4.02 

4.02 

4.02 

4.02 

4.02 

4.02 

4.02 

4.02 

4.02 

4.02 

4.02 

4.02 


.01 

6.51 

6.8 

6.9 

7.0 

7.1 

7.1 

7.2 

7.2 

7.3 

7.3 

7.4 

7.4 

7.5 

7.5 

5 

.05 

3.64 

3.74 

3.79 

3.83 

3.83 

3.83 

3.83 

3.83 

3.83 

3.83 

3.83 

3.83 

3.83 

3.83 


.01 

5.70 

5.96 

6.11 

6.18 

6.26 

6.33 

6.40 

6.44 

6.5 

6.6 

6.6 

6.7 

6.7 

6.8 

6 

.05 

3.46 

3.58 

3.64 

3.68 

3.68 

3.68 

3.68 

3.68 

3.68 

3.68 

3.68 

3.68 

3.68 

3.68 


.01 

5.24 

5.51 

5.65 

5.73 

5.81 

5.88 

5.95 

6.00 

6.0 

6.1 

6.2 

6.2 

6.3 

6.3 

7 

.05 

3.35 

3.47 

3.54 

3.58 

3.60 

3.61 

3.61 

3.61 

3.61 

3.61 

3.61 

3.61 

3.61 

3.61 


.01 

4.95 

5.22 

5.37 

5.45 

5.53 

5.61 

5.69 

5.73 

5.8 

5.8 

5.9 

5.9 

6.0 

6.0 

8 

.05 

3.26 

3.39 

3.47 

3.52 

3.55 

3.56 

3.56 

3.56 

3.56 

3.56 

3.56 

3.56 

3.56 

3.56 


.01 

4.74 

5.00 

5.14 

5.23 

5.32 

3.40 

5.47 

5.51 

5.5 

5.6 

5.7 

5.7 

5.8 

5.8 

9 

.05 

3.20 

3.34 

3.41 

3.47 

3.50 

3.52 

3.52 

3.52 

3.52 

3.52 

3.52 

3.52 

3.52 

3.52 


.01 

4.60 

4.86 

4.99 

5.08 

5.17 

5.25 

5.32 

5.36 

5.4 

5.5 

5.5 

5.6 

5.7 

5.7 

10 

.05 

3.15 

3.30 

3.37 

3.43 

3.46 

3.47 

3.47 

3.47 

3.47 

3.47 

3.47 

3.47 

3.47 

3.48 


.01 

4.48 

4.73 

4.88 

4.96 

5.06 

5.19 

5.20 

5.24 

5.28 

5.36 

5.42 

5.48 

5.54 

5.55 

11 

.05 

3.11 

3.27 

3.35 

3.39 

3.43 

3.44 

3.45 

3.46 

4.46 

3.46 

3.46 

3.46 

3.47 

3.48 


.01 

4.39 

4.63 

4.77 

4.86 

4.94 

5.01 

5.06 

5.12 

5.15 

5.24 

5.28 

5.34 

5.38 

5.39 

12 

.05 

3.08 

3.23 

3.33 

3.36 

3.40 

3.42 

3.44 

3.44 

3.46 

3.46 

3.46 

3.46 

3.47 

3.48 


.01 

4.32 

4.55 

4.68 

4.76 

4.81 

4.92 

4.96 

5.02 

5.07 

5.13 

5.17 

5.22 

5.24 

5.26 

13 

.05 

3.06 

2.21 

3.30 

3.35 

3.38 

3.41 

3.42 

3.44 

3.45 

3.45 

3.46 

3.46 

3.47 

3.47 


.01 

4.26 

4.48 

4.62 

4.69 

4.74 

4.84 

4.88 

4.94 

4.98 

5.04 

5.08 

5.13 

5.14 

5.15 

14 

.05 

3.03 

3.18 

3.27 

3.33 

3.37 

3.39 

3.41 

3.42 

3.44 

3.45 

3.46 

3.46 

3.47 

3.47 


.01 

4.21 

4.42 

455 

4.63 

4.70 

4.78 

4.83 

4.87 

4.91 

4.96 

5.00 

5.04 

5.06 

5.07 

15 

.05 

3.01 

3.16 

3.25 

3.31 

3.36 

3.38 

3.40 

3.42 

3.43 

3.44 

3.45 

3.46 

3.47 

3.47 


.01 

4.17 

4.37 

4.50 

4.58 

4.64 

4.72 

4.77 

4.81 

4.84 

4.90 

4.94 

4.97 

4.99 

5.00 



Tabla H: Tabla de t para comparaciones de dos colas entre p tratamientos y un control 
para un coeficiente de confianza conjunto de p = 0.95 y p = 0.01 


p = número de medias de tratamiento, sin incluir el control 


gi aei 

error 

p 

1 

2 

3 

4 

5 

6 

7 

8 

9 

5 

.95 

2.57 

3.03 

3.39 

3.66 

3.88 

4.06 

4.22 

4.36 

4.49 


.99 

4.03 

4.63 

5.09 

5.44 

5.73 

5.97 

6.18 

6.36 

6.53 

6 

.95 

2.45 

2.86 

3.18 

3.41 

3.60 

3.75 

3.88 

4.00 

4.11 


.99 

3.71 

4.22 

4.60 

4.88 

5.11 

5.30 

5.47 

5.61 

5.74 

7 

.95 

2.36 

2.75 

3.04 

3.24 

3.41 

3.54 

3.66 

3.76 

3.86 


.99 

3.50 

3.95 

4.28 

4.52 

4.71 

4.87 

5.01 

5.13 

5.24 

8 

.95 

2.31 

2.67 

2.94 

3.13 

3.28 

3.40 

3.51 

3.60 

3.68 


.99 

3.36 

3.77 

4.06 

4.27 

4.44 

4.58 

4.70 

4.81 

4.90 

9 

.95 

2.26 

2.61 

2.86 

3.04 

3.18 

3.29 

3.39 

3.48 

3.55 


.99 

3.25 

3.63 

3.90 

4.09 

4.24 

4.37 

4.48 

4.57 

4.65 

10 

.95 

2.23 

2.57 

2.81 

2.97 

3.11 

3.21 

3.31 

3.39 

3.46 


.99 

3.17 

3.53 

3.78 

3.95 

4.10 

4.21 

4.31 

4.40 

4.47 

11 

.95 

2.20 

2.53 

2.76 

2.92 

3.05 

3.15 

3.24 

3.31 

3.38 


.99 

3.11 

3.45 

3.68 

3.85 

3.98 

4.09 

4.18 

4.26 

4.33 

12 

.95 

2.18 

2.50 

2.72 

2.88 

3.00 

3.10 

3.18 

3.25 

3.32 


.99 

3.05 

3.39 

3.61 

3.76 

3.89 

3.99 

4.08 

4.15 

4.22 

13 

.95 

2.16 

2.48 

2.69 

2.84 

2.96 

3.06 

3.14 

3.21 

3.27 


.99 

3.01 

3.33 

3.54 

3.69 

3.81 

3.91 

3.99 

4.06 

4.13 

14 

.95 

2.14 

2.46 

2.67 

2.81 

2.93 

3.02 

3.10 

3.17 

3.23 


.99 

2.98 

3.29 

3.49 

3.64 

3.75 

3.84 

3.92 

3.99 

4.05 

15 

.95 

2.13 

2.44 

2.64 

2.79 

2.90 

2.99 

3.07 

3.13 

3.19 


.99 

2.95 

3.25 

3.45 

3.59 

3.70 

3.79 

3.86 

3.93 

3.99 

16 

.95 

2.12 

2.42 

2.63 

2.77 

2.88 

2.96 

3.04 

3.10 

3.16 


.99 

2.92 

3.22 

3.41 

3.55 

3.65 

3.74 

3.82 

3.88 

3.93 

17 

.95 

2.11 

2.41 

2.61 

2.75 

2.85 

2.94 

3.01 

3.08 

3.13 


.99 

2.90 

3.19 

3.38 

3.51 

3.62 

3.70 

3.77 

3.83 

3.89 

18 

.95 

2.10 

2.40 

2.59 

2.73 

2.84 

2.92 

2.99 

3.05 

3.11 


.99 

2.88 

3.17 

3.35 

3.48 

3.58 

3.67 

3.74 

3.80 

3.85 

19 

.95 

2.09 

2.39 

2.58 

2.72 

2.82 

2.90 

2.97 

3.04 

3.09 


.99 

2.86 

3.15 

3.33 

3.46 

3.55 

3.64 

3.70 

3.76 

3.81 

20 

.95 

2.09 

2.38 

2.57 

2.70 

2.81 

2.89 

2.96 

3.02 

3.07 


.99 

2.85 

3.13 

3.31 

3.43 

3.53 

3.61 

3.67 

3.73 

3.78 

24 

.95 

2.06 

2.35 

2.53 

2.66 

2.76 

2.84 

2.91 

2.96 

3.01 


.99 

2.80 

3.07 

3.24 

3.36 

3.45 

3.52 

3.58 

3.64 

3.69 

30 

.95 

2.04 

2.32 

2.50 

2.62 

2.72 

2.79 

2.86 

2.91 

2.96 


.99 

2.75 

3.01 

3.17 

3.28 

3.37 

3.44 

3.50 

3.55 

3.59 

40 

.95 

2.02 

2.29 

2.47 

2.58 

2.67 

2.75 

2.81 

2.86 

2.90 


.99 

2.70 

2.95 

3.10 

3.21 

3.29 

3.36 

3.41 

3.46 

3.50 

60 

.95 

2.00 

2.27 

2.43 

2.55 

2.63 

2.70 

2.76 

2.81 

2.85 


.99 

2.66 

2.90 

3.04 

3.14 

3.22 

3.28 

3.33 

3.38 

3.42 

120 

.95 

1.98 

2.24 

2.40 

2.51 

2.59 

2.66 

2.71 

2.76 

2.80 


.99 

2.62 

2.84 

2.98 

3.08 

3.15 

3.21 

3.25 

3.30 

3.33 

00 

.95 

1.96 

2.21 

2.37 

2.47 

2.55 

2.62 

2.67 

2.71 

2.75 


.99 

2.58 

2.79 

2.92 

3.01 

3.08 

3.14 

3.18 

3.22 

Km 



Tabla I: Tabla de t para comparaciones de una cola entre p medias de tratamiento y un control para un 
coeficiente de confianza de p - 0.95 y p = 0.99 
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